Tasvir nima?

4 minute read

Tasvir ta’rifi

Tasvir — bu obyekt, sahna, inson yoki hatto g‘oya (kontsept)ning vizual ifodasidir. U fotosurat, rasm, chizma, sxema yoki skanerlash natijasi bo‘lishi ham mumkin. Ammo eng qiziqarli jihati tasvir aslida funksiya hamdir. Yani, n o‘lchovli funksiya.

Hozircha uni ikki o‘lchamli holatda (n=2) deb olaylik. Biz uni (F(X,Y)) deb belgilaymiz, bu yerda (X) va (Y) — fazoviy koordinatalar.

Funksiya (F) ning (x_i, y_i) koordinatalaridagi qiymati bu o‘sha nuqtadagi yorqinlik yoki intensivlik ni bildiradi. Aynan shu intensivlik bizga tasvirdagi yorug‘lik va soya hissini beradi. Ko‘pincha bu koordinatalar juftligi (x_1, y_1) piksel (picture element) deb ham ataladi. (F) funksiyasining har bir koordinatadagi qiymati fizik ma’noga ega

(F(X,Y)) ikki omil bilan belgilanadi:

  1. Manbadan tushayotgan yorug‘lik miqdori;
  2. Obyekt tomonidan qaytarilgan yorug‘lik miqdori.

Intensivlik qiymatlari odatda manfiy bo‘lmaydi va cheklangan diapazonda bo‘ladi.


Bundan tashqari, 3D yoki hajmli (volumetric) tasvirlar ham mavjud. Ularning o‘lchamlari uchta: (F(X,Y,Z)). Bu yerda (x_i, y_i, z_i) koordinatalari voxel (volume element) deb ataladi. Misollar: tibbiy tomografiya, magnit-rezonans tasvirlash (MRI), yoki 3D mikroskopiyalar. Ba’zan 2D tasvirdan 3D tasvirni rekonstruksiya qilish ham mumkin, bu haqda keyinroq yana gaplashamiz.


Rang va kanallar

Endi fazoni tushungan bo‘lsak, rang haqida gaplashaylik. Siz avval “kanallar”(channels) degan so‘zni eshitgansiz, to‘g‘rimi? kanal bu rasmni tashkil etuvchi rang komponentidir.

Agar biz (F(X,Y)) ni olayotgan bo‘lsak, unda har bir rang uchun alohida (F) mavjud bo‘ladi. Masalan, qizil kanal uchun intensivlik yuqori bo‘lsa, demak o‘sha piksel juda qizil; past bo‘lsa — qizillik deyarli yo‘q.

Odatda rangli tasvirlar RGB tizimida saqlanadi:

  • R (Red) — Qizil
  • G (Green) — Yashil
  • B (Blue) — Ko‘k

Har bir kanal uchun intensivlik qiymati 0 dan 255 gacha bo‘ladi:

  • 0 → rang yo‘q
  • 255 → maksimal rang intensivligi

Boshqa rang tizimlarida bu qiymatlar turlicha birlashtirilishi mumkin, shuning uchun tasvir ma’lumotining manbasini to‘g‘ri tushunish muhim.


Maskalar va yorliqli tasvirlar

Ba’zi tasvirlarda (F(x_i, y_i)) koordinatalari intensivlikni emas, yorliqni (label) ifodalaydi. Eng oddiy misol — fonni (background) va asosiy obyektni (foreground) ajratish.

Masalan:

  • Foreground (asosiy obyekt) → 1
  • Background (fon) → 0

Bunday tasvirlar binary mask yoki yorliqli tasvirlar deb ataladi. Agar ikkidan ortiq yorliq mavjud bo‘lsa, ular segmentatsiya xaritalari deyiladi.


4D va 5D tasvirlar haqida

Ba’zi ilmiy sohalarda, ayniqsa biotibbiyot va mikroskopiyada 4D yoki 5D tasvirlar tushunchasi ishlatiladi. Bu nimani anglatadi? Har bir yangi o‘lchov — bu qo‘shimcha ma’lumot manbai:

  • 3D — fazoviy hajm
  • 4D — vaqt o‘lchovi qo‘shilgan (tasvir vaqt davomida olingan)
  • 5D — rangli yoki ko‘p-kanalli tasvir

Shunday qilib, 5D tasvir — bu vaqt davomida olingan ko‘p-kanalli 3D hajmli tasvirdir.


Tasvirlar kompyuterda qanday saqlanadi?

Ko‘pincha tasvirlar matritsa yoki array sifatida ifodalanadi. Tasvirni 2D sonli massiv sifatida tasavvur qilish juda qulay — chunki kompyuterlar massivlar bilan juda yaxshi ishlaydi.

Bu yondashuv konvolyutsion neyron tarmoqlarda (CNN) tasvirlarni qanday qayta ishlashini tushunishda ham asqotadi.

Tasvirlar ba’zida graf sifatida ham ifodalanadi — bu holatda har bir nuqta tugun (node), qo‘shni nuqtalar esa qirralar (edges) bilan bog‘lanadi. Demak, graf algoritmlarini ham tasvirlarga tatbiq etish mumkin!


Tasvirlar va boshqa ma’lumot turlari

Tasvir va video farqi

video — bu vaqt o‘lchovi qo‘shilgan tasvirlar ketma-ketligi.

Agar biz 2D tasvir funksiyasini olayotgan bo‘lsak, unda vaqt o‘lchovini qo‘shsak, bu (F(X,Y,T)) shaklida bo‘ladi.

  • Tasvir — vaqtning bitta nuqtasidagi statik ko‘rinish.
  • Video — bir necha tasvirlar ketma-ket ko‘rsatilganda paydo bo‘ladigan harakat illuziyasi.

Tasvir va jadval (tabular) ma’lumot farqi

Jadval ko‘rinishidagi ma’lumotlarda o‘lchovlar odatda ustunlar (xususiyatlar) soni bilan belgilanadi. Vizual ma’lumotlarda esa o‘lchov — bu fazoviy o‘lchamlar (x va y, ba’zan z).

Tasvirlardagi xususiyatlar odatda feature extraction — ya’ni xususiyatlarni ajratish jarayoni orqali olinadi. Bu an’anaviy algoritmlar yoki chuqur o‘rganish (deep learning) yordamida amalga oshiriladi.

Jadval ma’lumotlari uchun ishlatiladigan amallar (masalan, normalizatsiya, to‘ldirish, kodlash) tasvirlar dunyosida ham mavjud, faqat nomi boshqa: resize, normalization, augmentation, va hokazo.


Asosiy farqlar

Quyidagi jadvalda tasvir, video, audio va jadval ma’lumotlar o‘rtasidagi asosiy farqlar keltirilgan:

# Xususiyat Tasvir (Image) Video Audio Jadval ma’lumot (Tabular Data)
1 Turi Bir vaqt nuqtasidagi statik tasvir Vaqt davomida ketma-ket tasvirlar Bir o‘lchovli audio signallar Qator va ustunlardan iborat tuzilgan ma’lumot
2 Ma’lumot ko‘rinishi Odatda 2D piksel massiv Odatda 3D kadrlar massiv (x, y, vaqt) 1D audio namunalar ketma-ketligi 2D jadval — ustunlar (xususiyatlar) va qatorlar (namunalar)
3 Fayl turlari JPEG, PNG, RAW va boshqalar MP4, AVI, MOV va boshqalar WAV, MP3, FLAC va boshqalar CSV, Excel (.xlsx, .xls), Database (SQL, Parquet)
4 Ma’lumotni kengaytirish (Augmentatsiya) Aylantirish, burish, kesish, kontrast o‘zgartirish Tezlikni o‘zgartirish, vaqtli siljitish, fon o‘chirish Shovqin qo‘shish, reverberatsiya, spektral manipulyatsiya Oversampling (SMOTE, ROSE, ADASYN)
5 Xususiyat ajratish (Feature Extraction) Chegaralar, tekstura, rang, shakl Chegaralar, harakat, optik oqim, trayektoriyalar Spektrogram, MFCC, Chroma xususiyatlar Statistik tahlil, Feature engineering, Agregatsiya
6 O‘rganish modellari CNN (Konvolyutsion Neyron Tarmoqlar) 3D CNN, RNN (rekurrent tarmoqlar) CNN, RNN, Transformer Regression, Decision Tree, Random Forest, Gradient Boosting
7 Mashina o‘rganish vazifalari Tasvir klassifikatsiyasi, segmentatsiya, obyekt aniqlash Harakatni aniqlash, vaqtli model, trekking Nutqni tanish, ovoz identifikatsiyasi, janr aniqlash Regressiya, klassifikatsiya, klasterlash
8 Hisoblash murakkabligi Nisbatan past Yuqori (ko‘p kadrli hisoblash) O‘rta yoki yuqori Odatda eng arzon (hisoblash jihatdan)
9 Qo‘llanish sohalari Yuzni tanish, tibbiyotda analiz, sanoat nazorati Sign-tillar tarjimasi, kuzatuv tizimlari Ovozli yordamchilar, nutqni matnga aylantirish Firibgarlikni aniqlash, prognozlash, tahlil

Bu jadval orqali ko‘rish mumkinki, tasvir va video ma’lumotlar fazoviy va vaqtli o‘lchovlarni o‘z ichiga oladi, audio — to‘lqinli signal asosida, jadval esa an’anaviy raqamli qiymatlar asosida ishlaydi. Har bir ma’lumot turi o‘ziga xos model, qayta ishlash va o‘rganish usullarini talab qiladi.

🎯 Xulosa: Tasvirlar — bu fazoviy ma’lumotlarning boy manbai. Ularni to‘g‘ri talqin qilish kompyuter ko‘rish tizimlarining muvaffaqiyat kalitidir.