Tasvir nima?
Tasvir ta’rifi
Tasvir — bu obyekt, sahna, inson yoki hatto g‘oya (kontsept)ning vizual ifodasidir. U fotosurat, rasm, chizma, sxema yoki skanerlash natijasi bo‘lishi ham mumkin. Ammo eng qiziqarli jihati tasvir aslida funksiya hamdir. Yani, n o‘lchovli funksiya.
Hozircha uni ikki o‘lchamli holatda (n=2) deb olaylik. Biz uni (F(X,Y)) deb belgilaymiz, bu yerda (X) va (Y) — fazoviy koordinatalar.
Funksiya (F) ning (x_i, y_i) koordinatalaridagi qiymati bu o‘sha nuqtadagi yorqinlik yoki intensivlik ni bildiradi. Aynan shu intensivlik bizga tasvirdagi yorug‘lik va soya hissini beradi. Ko‘pincha bu koordinatalar juftligi (x_1, y_1) piksel (picture element) deb ham ataladi. (F) funksiyasining har bir koordinatadagi qiymati fizik ma’noga ega
(F(X,Y)) ikki omil bilan belgilanadi:
- Manbadan tushayotgan yorug‘lik miqdori;
- Obyekt tomonidan qaytarilgan yorug‘lik miqdori.
Intensivlik qiymatlari odatda manfiy bo‘lmaydi va cheklangan diapazonda bo‘ladi.
Bundan tashqari, 3D yoki hajmli (volumetric) tasvirlar ham mavjud. Ularning o‘lchamlari uchta: (F(X,Y,Z)). Bu yerda (x_i, y_i, z_i) koordinatalari voxel (volume element) deb ataladi. Misollar: tibbiy tomografiya, magnit-rezonans tasvirlash (MRI), yoki 3D mikroskopiyalar. Ba’zan 2D tasvirdan 3D tasvirni rekonstruksiya qilish ham mumkin, bu haqda keyinroq yana gaplashamiz.
Rang va kanallar
Endi fazoni tushungan bo‘lsak, rang haqida gaplashaylik. Siz avval “kanallar”(channels) degan so‘zni eshitgansiz, to‘g‘rimi? kanal bu rasmni tashkil etuvchi rang komponentidir.
Agar biz (F(X,Y)) ni olayotgan bo‘lsak, unda har bir rang uchun alohida (F) mavjud bo‘ladi. Masalan, qizil kanal uchun intensivlik yuqori bo‘lsa, demak o‘sha piksel juda qizil; past bo‘lsa — qizillik deyarli yo‘q.
Odatda rangli tasvirlar RGB tizimida saqlanadi:
- R (Red) — Qizil
- G (Green) — Yashil
- B (Blue) — Ko‘k
Har bir kanal uchun intensivlik qiymati 0 dan 255 gacha bo‘ladi:
0→ rang yo‘q255→ maksimal rang intensivligi
Boshqa rang tizimlarida bu qiymatlar turlicha birlashtirilishi mumkin, shuning uchun tasvir ma’lumotining manbasini to‘g‘ri tushunish muhim.
Maskalar va yorliqli tasvirlar
Ba’zi tasvirlarda (F(x_i, y_i)) koordinatalari intensivlikni emas, yorliqni (label) ifodalaydi. Eng oddiy misol — fonni (background) va asosiy obyektni (foreground) ajratish.
Masalan:
- Foreground (asosiy obyekt) → 1
- Background (fon) → 0
Bunday tasvirlar binary mask yoki yorliqli tasvirlar deb ataladi. Agar ikkidan ortiq yorliq mavjud bo‘lsa, ular segmentatsiya xaritalari deyiladi.
4D va 5D tasvirlar haqida
Ba’zi ilmiy sohalarda, ayniqsa biotibbiyot va mikroskopiyada 4D yoki 5D tasvirlar tushunchasi ishlatiladi. Bu nimani anglatadi? Har bir yangi o‘lchov — bu qo‘shimcha ma’lumot manbai:
- 3D — fazoviy hajm
- 4D — vaqt o‘lchovi qo‘shilgan (tasvir vaqt davomida olingan)
- 5D — rangli yoki ko‘p-kanalli tasvir
Shunday qilib, 5D tasvir — bu vaqt davomida olingan ko‘p-kanalli 3D hajmli tasvirdir.
Tasvirlar kompyuterda qanday saqlanadi?
Ko‘pincha tasvirlar matritsa yoki array sifatida ifodalanadi. Tasvirni 2D sonli massiv sifatida tasavvur qilish juda qulay — chunki kompyuterlar massivlar bilan juda yaxshi ishlaydi.
Bu yondashuv konvolyutsion neyron tarmoqlarda (CNN) tasvirlarni qanday qayta ishlashini tushunishda ham asqotadi.
Tasvirlar ba’zida graf sifatida ham ifodalanadi — bu holatda har bir nuqta tugun (node), qo‘shni nuqtalar esa qirralar (edges) bilan bog‘lanadi. Demak, graf algoritmlarini ham tasvirlarga tatbiq etish mumkin!
Tasvirlar va boshqa ma’lumot turlari
Tasvir va video farqi
video — bu vaqt o‘lchovi qo‘shilgan tasvirlar ketma-ketligi.
Agar biz 2D tasvir funksiyasini olayotgan bo‘lsak, unda vaqt o‘lchovini qo‘shsak, bu (F(X,Y,T)) shaklida bo‘ladi.
- Tasvir — vaqtning bitta nuqtasidagi statik ko‘rinish.
- Video — bir necha tasvirlar ketma-ket ko‘rsatilganda paydo bo‘ladigan harakat illuziyasi.
Tasvir va jadval (tabular) ma’lumot farqi
Jadval ko‘rinishidagi ma’lumotlarda o‘lchovlar odatda ustunlar (xususiyatlar) soni bilan belgilanadi. Vizual ma’lumotlarda esa o‘lchov — bu fazoviy o‘lchamlar (x va y, ba’zan z).
Tasvirlardagi xususiyatlar odatda feature extraction — ya’ni xususiyatlarni ajratish jarayoni orqali olinadi. Bu an’anaviy algoritmlar yoki chuqur o‘rganish (deep learning) yordamida amalga oshiriladi.
Jadval ma’lumotlari uchun ishlatiladigan amallar (masalan, normalizatsiya, to‘ldirish, kodlash) tasvirlar dunyosida ham mavjud, faqat nomi boshqa: resize, normalization, augmentation, va hokazo.
Asosiy farqlar
Quyidagi jadvalda tasvir, video, audio va jadval ma’lumotlar o‘rtasidagi asosiy farqlar keltirilgan:
| # | Xususiyat | Tasvir (Image) | Video | Audio | Jadval ma’lumot (Tabular Data) |
|---|---|---|---|---|---|
| 1 | Turi | Bir vaqt nuqtasidagi statik tasvir | Vaqt davomida ketma-ket tasvirlar | Bir o‘lchovli audio signallar | Qator va ustunlardan iborat tuzilgan ma’lumot |
| 2 | Ma’lumot ko‘rinishi | Odatda 2D piksel massiv | Odatda 3D kadrlar massiv (x, y, vaqt) | 1D audio namunalar ketma-ketligi | 2D jadval — ustunlar (xususiyatlar) va qatorlar (namunalar) |
| 3 | Fayl turlari | JPEG, PNG, RAW va boshqalar | MP4, AVI, MOV va boshqalar | WAV, MP3, FLAC va boshqalar | CSV, Excel (.xlsx, .xls), Database (SQL, Parquet) |
| 4 | Ma’lumotni kengaytirish (Augmentatsiya) | Aylantirish, burish, kesish, kontrast o‘zgartirish | Tezlikni o‘zgartirish, vaqtli siljitish, fon o‘chirish | Shovqin qo‘shish, reverberatsiya, spektral manipulyatsiya | Oversampling (SMOTE, ROSE, ADASYN) |
| 5 | Xususiyat ajratish (Feature Extraction) | Chegaralar, tekstura, rang, shakl | Chegaralar, harakat, optik oqim, trayektoriyalar | Spektrogram, MFCC, Chroma xususiyatlar | Statistik tahlil, Feature engineering, Agregatsiya |
| 6 | O‘rganish modellari | CNN (Konvolyutsion Neyron Tarmoqlar) | 3D CNN, RNN (rekurrent tarmoqlar) | CNN, RNN, Transformer | Regression, Decision Tree, Random Forest, Gradient Boosting |
| 7 | Mashina o‘rganish vazifalari | Tasvir klassifikatsiyasi, segmentatsiya, obyekt aniqlash | Harakatni aniqlash, vaqtli model, trekking | Nutqni tanish, ovoz identifikatsiyasi, janr aniqlash | Regressiya, klassifikatsiya, klasterlash |
| 8 | Hisoblash murakkabligi | Nisbatan past | Yuqori (ko‘p kadrli hisoblash) | O‘rta yoki yuqori | Odatda eng arzon (hisoblash jihatdan) |
| 9 | Qo‘llanish sohalari | Yuzni tanish, tibbiyotda analiz, sanoat nazorati | Sign-tillar tarjimasi, kuzatuv tizimlari | Ovozli yordamchilar, nutqni matnga aylantirish | Firibgarlikni aniqlash, prognozlash, tahlil |
Bu jadval orqali ko‘rish mumkinki, tasvir va video ma’lumotlar fazoviy va vaqtli o‘lchovlarni o‘z ichiga oladi, audio — to‘lqinli signal asosida, jadval esa an’anaviy raqamli qiymatlar asosida ishlaydi. Har bir ma’lumot turi o‘ziga xos model, qayta ishlash va o‘rganish usullarini talab qiladi.
🎯 Xulosa: Tasvirlar — bu fazoviy ma’lumotlarning boy manbai. Ularni to‘g‘ri talqin qilish kompyuter ko‘rish tizimlarining muvaffaqiyat kalitidir.