Haqiqiy hayotda tasvirga olish

11 minute read

Bir uyum mitti mushukchalarni suratga olishga harakat qilib ko‘rganmisiz? Mushukchalar yoqimtoy, lekin eng g‘alati trayektoriyalarda harakatlanadigan jonzotlar. Ular eng yoqimli ishni qiladi, lekin bu holat yarim soniya ham davom etmaydi, darrov undan ham yoqimlisini qo‘shib yuboradi. Bir qarasang, siz bitta mushukchani kadrga sig‘dirish uchun tanangizni orqaga qayirib turibsiz, shu bilan bir paytda zoomni, kamera burchagini o‘zgartiryapsiz, yana boshqa mushukcha esa oyog‘ingizga tirmashib chiqyapti. Ularning yumshoqligiga shunchalik berilib ketasizki, suratlarni tekshirishga vaqt topolmaysiz. Keyin o‘tirib ko‘rasiz. Ular hammasi shunchaki xira. Faqat bir-ikkitasi telefonda saqlab qolishga arziydi.

Mushukchalar uyumi haqida hikoya oddiy, lekin u real hayotda tasvirga olish nega qiyinligini yaxshi ko‘rsatadi. Namuna (mushukchalar bor ssenariy) ko‘pincha kamera moslashishga ulguradigan tezlikdan tezroq o‘zgaradi. Mushukchani kuzatishga urinmaydigan, bir joyda turgan kamerani ushlab turish ham oson emas, chunki obyektimiz (mushukcha) fazoda shunday harakatlanadiki, bu kamera fokusini doim o‘zgartirib yuboradi. Oq fonni olish uchun linzani almashtirish ham obyektning kameraga masofasiga qarab distorsiyaga olib kelishi mumkin (quyidagi yoqimli misolga qarang). Qiziqarli hodisa (mushukchaning o‘sha bitta juda yoqimli pozasi) yuzlab boshqa unchalik qiziq bo‘lmagan rasmlar ichida yo‘qolib ketadi. Mushukcha misoli biroz kulgili, lekin bu qiyinchiliklar turli boshqa ssenariylarda ham uchraydi. Tasvirga olish oson emas. Shunga qaramay, internet yoqimli mushuk suratlariga to‘lib ketgan.

Obyekt masofasiga qarab distorsiyani ko‘rsatadigan mushukcha "bo‘sa"si

Shu payt “agar bizda shunchaki yaxshiroq kamera bo‘lsa, yuqori aniqlik (high resolution) bilan ishlaydigan bo‘lsa, hammasi hal bo‘lardi” deb o‘ylash oson. O‘shanda biz istagan yoqimli suratlarni olardik. Bundan tashqari, bu postdagi bilimlar bilan faqat mushukchalarni suratga olish bilan cheklanmaymiz: masalan, “nanny cam” (bolalar kuzatuv kamerasi)ga model o‘rnatib, mushukchalar hali ham onasi bilan birga ekanini tekshirib turishni xohlaymiz, shunda ularning hammasi xavfsizligini bilib turamiz. Ideal tuyuladi, shundaymi?

Bozorga chiqib, “eng yangi, eng tiniq” kamerani sotib olishga shoshilmasdan oldin, “endi datamiz yaxshiroq bo‘ladi, model o‘qitish juda oson, modeli juda aniq bo‘ladi, mushukcha tracking bozorida kosmos darajadagi natija bo‘ladi” deb o‘ylab yubormaslik uchun bu paragraf sizni yanada samarali yo‘nalishga buradi va ehtimol sizga ko‘p vaqt hamda pulni tejab beradi. Yuqori aniqlik hamma muammo uchun javob emas. Avvalo, tasvirlar bilan ishlaydigan tipik neyron tarmoq modeli bu konvolyutsion neyron tarmoq (Convolutional Neural Network, CNN). CNN’lar ma’lum o‘lchamdagi tasvirni kutadi. Katta tasvir katta model degani. O‘qitish ko‘proq vaqt oladi. Kompyuteringizning RAM’i ham cheklangan bo‘lishi ehtimol. Tasvir o‘lchami kattalashsa, har bir iteratsiya uchun RAM cheklangani sababli o‘qitishga sig‘adigan tasvirlar soni kamayadi.

Aqlga birinchi keladigan yechim: unda ko‘proq GPU va ko‘proq RAM’ga ega kompyuter olamiz, deymiz. Bu shuni anglatadiki, kamerani sotib olishdan tashqari, mushukcha modeli uchun training qiladigan servisga ham ko‘proq to‘laysiz. Umuman olganda, bu real dunyo ssenariylarini to‘liq aks ettirmaydi. To‘xtang, aslida bizning holatimiz boshidan shunday emasmidi? Modelni nanny cam’ning o’ziga (hardware) qanday sig‘diramiz?

Bizda g‘oya bor: katta model bilan bir xil accuracy beradigan kichikroq modelni sinab ko‘ramiz! Aytgancha, bu haqiqatan ham qilsa bo‘ladigan narsa. Lekin shunday qilsak ham, eng yuqori resolutiondagi rasmlarni yig‘ish har doim ham yaxshi g‘oya emas, chunki odatda uni olish va uzatish ko‘proq vaqt oladi. 50GB mushukcha suratlari 50GB data. Yana bir argument: kompyuter resurslari odatda yo pullik bo‘ladi, yo umumiy (shared) bo‘ladi. Birinchi holatda bu pulni havoga uchirish. Ikkinchi holatda esa butun serverni band qilib, boshqalar ishiga halaqit qilish.

Resolution nafaqat siz qiziqqan signalni ushlash qobiliyatingizni, balki shovqinni ham ko‘proq yig‘ish qobiliyatingizni kuchaytiradi. Shuning uchun ba’zan past aniqlikdagi tasvirda nimanidir o‘rganish osonroq bo‘ladi. Past aniqlik training’ni tezlashtirishi, aniqlikni oshirishi va hisoblash hamda pul jihatdan arzonroq modelga olib kelishi mumkin. Bu yerda xulosa shuki: tasvirning shovqin xususiyatlari va modelni o‘qitish hamda deploy qilish uchun kerak bo‘ladigan infratuzilmani hisobga olgan holda, imkon qadar eng yuqori aniqlikni tanlang. Va oxiri: biz umuman nega yuqori sifatli kamera ishlatyapmiz? Agar modelni nanny cam’da ishlatmoqchi bo‘lsak, rasmlarni ham nanny cam’ning o‘zidan olishimiz mumkin.

Hamma narsani tasvirga olish

Tasvirga olish texnikalari haqida: biz ularni doimiy ravishda yaxshilashga, ko’proq narsalarni tasvirga muhrlashga harakat qilamiz. Bu faqat mushukcha suratlari uchun emas, atrofimizdagi dunyo uchun ham shunday. Inson tabiatan qiziquvchan. Birinchi bobda ko‘rganimizdek, qaror qabul qilishda ko‘rish (vision)ga tayanamiz. Qaror qiyin bo‘lsa, uni “aniq ko‘rishni” xohlaymiz (so‘z o‘yini bo‘lsa ham).

Shuning uchun tur sifatida ko‘zimiz ko‘ra oladigan diapazondan tashqarini ham ko‘ra olishning yangi yo‘llarini ishlab chiqqanimiz ajab emas. Aslida tabiat bizga ko‘rishga ruxsat bermagan narsalarni ko‘rishni xohlaymiz. Deyarli kafolat bera olamanki, agar qayerdadir “bu nimaga o‘xshaydi” degan ishonchsizlik bo‘lsa, albatta kimdir uni tasvirga olishga urinayotgan bo‘ladi.

Inson sifatida biz spektrning faqat bir bo‘lagini ko‘ramiz. Biz buni ko‘rinadigan spektr (visible spectrum) deymiz. Quyidagi rasm uning qanchalik tor ekanini ko‘rsatadi:

Elektromagnit spektrga nisbatan ko‘rinadigan spektrning torligini ko‘rsatadigan rasm.
https://open.lib.umn.edu/intropsyc/chapter/4-2-seeing/ manbasidan

Ona tabiat berganidan ko‘prog‘ini ko‘rish uchun bizga o‘sha spektrdan tashqarini “ushlaydigan” sensorlar kerak. Boshqacha aytganda, turli to‘lqin uzunliklarida (wavelength) narsalarni aniqlashimiz kerak. Infraqizil (Infrared, IR) tun ko‘rish qurilmalarida va ayrim astronomik kuzatuvlarda ishlatiladi. Magnit-rezonans (magnetic resonance) kuchli magnit maydonlar va radio to‘lqinlar yordamida insonning yumshoq to‘qimalarini tasvirlaydi. Biz yorug‘likka tayanmaydigan ko‘rish usullarini ham yaratdik. Masalan, elektron mikroskopiya (electron microscopy) elektronlar yordamida an’anaviy optik mikroskopiyadan ancha yuqori aniqlikda “yaqinlashtiradi”. Ultratovush (ultrasound) ham juda yaxshi misol. Ultratovush tasvirlash (ultrasound imaging) tovush to‘lqinlaridan foydalanib ichki organlar va to‘qimalarning real vaqt rejimidagi batafsil tasvirlarini yaratadi, bu esa standart yorug‘likka asoslangan tasvirlash usullari bilan erishib bo‘lmaydigan noinvaziv(teri ichiga oʻtmasdan) va dinamik perspektivani beradi.

Keyin ulkan linzalarimizni osmon tomonga burdik: ilgari ko‘rinmagan va noma’lum bo‘lgan narsalarni ko‘rish uchun. Shuningdek, ularni juda kichik olamga ham qaratdik: DNK tuzilmasi va hatto alohida atomlarning tasvirlarini yaratdik. Bu instrumentlarning ikkalasi ham yorug‘likni boshqarish g‘oyasiga tayanadi. Biz turli xil ko‘zgular yoki linzalardan foydalanamiz, yorug‘likni kerakli tarzda bukamiz va fokuslaymiz.

Ko‘rishga shunchalik “obsessiya”miz borki, olimlar ayrim hayvonlarning DNK ketma-ketligini ham o‘zgartirib, qiziq proteinlarni maxsus protein bilan “tag” qilishadi (green fluorescence protein, GFP). Nomi aytib turganidek, namuna yashil to‘lqin uzunligidagi yorug‘lik bilan yoritilganda, GFP orqaga floresans signal qaytaradi. Endi qiziq protein qayerda ifodalanayotganini bilish osonroq bo‘ladi, chunki olimlar uni tasvirlay oladi.

Shundan keyin gap bu tizimni yaxshilashga borib taqaldi: ko‘proq kanallar, uzoqroq vaqt shkalasi, yaxshiroq aniqlik. Bunga yaxshi misol: bugun mikroskoplar bir kechada terabaytlar miqdorida data ishlab chiqaradi.

Bu birlashgan sa’y-harakatning zo‘r misoli quyidagi videoda. Unda floresans protein bilan belgilangan (tag qilingan) baliq embrionining rivojlanayotgan 3D tasviri proyeksiyasining time-lapse’ini ko‘rasiz. Rasmda ko‘rayotgan har bir rangli nuqta alohida hujayrani bildiradi.

Fisho embrioni. https://www.biorxiv.org/content/10.1101/2023.03.06.531398v2.supplementary-material manbasidan moslashtirilgan

Tasvirlashdagi bu xilma-xillik juda hayratlanarli. Optik vositalar koinotni idrok qilishimizdagi “ko‘z”ga aylandi. Ular bizga olam va hayotning o‘zini tushunishni tubdan o‘zgartirgan insight’lar berdi. Biz buni har kuni uzoqda bo‘lgan yaqinlarimizga rasm yuborishda ishlatamiz. Shifokorlar yaqinroq ko‘rishi kerak bo‘lsa, rentgen (x-ray) qilamiz. Homiladorlar bolasini tekshirish uchun ultratovush tekshiruviga kiradi. Qora tuynukdek ulkan va elektronlardek kichik narsalarni tasvirlay olganimiz biroz sehrli, hattoki bir oz ertakona tuyulishi mumkin. Va rostini aytsak, shunday ham.

Tasvirlashda perspektiva

Avval ko‘rganimizdek, narsalarni turli yo‘llar bilan tasvirlashga o‘rganib ketdik. Bugun bu odatiy rutinga o‘xshaydi, lekin bunga erishish uchun juda ko‘p vaqt va mehnat ketgan. Hozir esa, ko‘rinishidan, sekinlashmayapmiz. Biroq, biz doim yangi ko‘rish usullarini topyapmiz. Yangi tasvirlash yo‘llarini. Yaxshiroq ko‘rish uchun yangi instrumentlar qurishda davom etar ekanmiz, yangi hikoyalar va sirlar ochiladi. Bu postda biz o‘tmishda allaqachon ochilgan ayrim sirlarni ko‘rsatamiz.

Photo 51

Photo 51. Muallif: Raymond Gosling/King's College London

DNKning ilk suratlaridan biri Photo 51 nomi bilan ham tanilgan. Uni tasvirlash uchun DNK tolalaridan iborat kristall gelning fiber diffraction (tolali difraksiya) tasviriga asoslangan texnologiya ishlatilgan. Surat 1952-yil may oyida Rosalind Franklin rahbarligida ishlagan magistrant Raymond Gosling tomonidan olingan. U 1953-yilda Watson va Crick tomonidan qurilgan double helix (ikki spiral) modelida muhim dalil bo‘lib xizmat qilgan. Bu surat atrofida ko‘p bahslar bor. Sabablardan biri Rosalind Franklinning erta ishlari qo‘shgan hissasi yetarlicha tan olinmagani va surat Watson hamda Crick’ka qanday sharoitda yetib borgani bilan bog‘liq. Shunga qaramay, u DNK tuzilishini tushunishimizga va keyinchalik yaratilgan texnologiyalarga sezilarli hissa qo‘shgan.

Pale blue dot

The Pale Blue Dot. Voyager 1

Pale blue dot bu 1990-yilda kosmik zond tomonidan olingan surat. Yer shunchalik kichikki, kadrda u hatto bitta pikselning ham kichik qismiga to‘g‘ri keladi. Surat koinotning ulkanligiga nisbatan Yerning naqadar mitti va “nozik” ekanini ko‘rsatgani uchun katta mashhurlikka erishgan. Bu surat Carl Sagan’ni “The Pale Blue Dot” kitobini yozishga ilhomlantirgan. Rasm Voyager 1 zondidagi 1500mm yuqori aniqlikdagi tor burchakli (narrow-angle) kamera orqali olingan. Shu kosmik zond “Quyosh tizimining oilaviy portreti”ni (Family portrait of the solar system) ham suratga olgan.

Qora tuynuk

M87. Event Horizon Telescope

Yana bir astronomik jihatdan nihoyatda muhim voqea 2019-yil aprel oyida yuz berdi: tadqiqotchilar ilk bor qora tuynuk tasvirini oldi! Bu Virgo yulduz turkumidagi M87 galaktikasi markazida joylashgan supermassive black hole bo‘lib, Yerdan taxminan 55 million yorug‘lik yili uzoqlikda. Bu ajoyib tasvir Event Horizon Telescope mahsuli bo‘ldi: sinxronlashtirilgan radio observatoriyalarning global tarmog‘i birgalikda ishlash orqali Yer kattaligicha virtual teleskop hosil qilgan. Yig‘ilgan data juda ulkan edi, petabaytdan ham ko‘p, shuning uchun hajmi sababli uni qayta ishlash uchun jismonan tashish (physical transport)ga to‘g‘ri kelgan. Ular near-infrared, x-ray, millimeter wavelengths va radio kuzatuvlardan kelgan ma’lumotlarni birlashtirishi kerak bo‘lgan. Bu yutuq Event Horizon Telescope Collaboration’ning yillar davom etgan mehnati yakuni edi.

Sagittarius A. Event Horizon Telescope

M87dagi muvaffaqiyatdan keyin astronomlar galaktikamiz markazidagi supermassive black hole bo‘lgan Sagittarius A’ni tasvirlashni maqsad qildi. Sagittarius A’ni tasvirlash o‘ziga xos qiyinchiliklarni keltirib chiqardi: uning o‘lchami kichikroq, atrof-muhitdagi o‘zgaruvchanlik esa juda tez, bu kattaroq qora tuynuklar, masalan M87 atrofidagi muhitga qaraganda ancha tez o‘zgaradi. Bu tez harakat Sagittarius A* atrofidagi tuzilmani to‘g‘ri aks ettiradigan barqaror tasvirni olishni qiyinlashtirdi. Xuddi mushukcha misolimiz kabi! Shunga qaramay, olingan tasvirlar Einstein’ning umumiy nisbiylik nazariyasini (general relativity) ekstremal gravitatsion sharoitlarda sinash uchun muhim. Bu kuzatuvlar juda zarur bo‘lsa-da, ular umumiy nisbiylik bashoratlarini tekshirish uchun ishlatiladigan kengroq metodlar to‘plamining bir qismi, xolos.

Tasvirlar, tasvirlar, tasvirlar

DNK ichidan dekodlangan ot videosi. Manba: https://doi.org/10.1038/nature23017

Bu safar biroz “twist”. Bu yangi tasvirlash usuli emas, balki tasvirlarni o‘qish va arxivlashning yangi yo‘li. Yuqorida ko‘rayotgan GIF bu tirik bakteriyaning DNKsi ichida saqlangan rasm. Buni 2017-yilda bir guruh olimlar proof-of-concept sifatida yaratdi: tirik organizm data arxivlash uchun juda yaxshi vosita bo‘lishi mumkinligini ko‘rsatish uchun. Buning uchun avval tasvir qiymatlarini nukleotidlar kodiga (mashhur ATCG) tarjima qilishdi. Keyin bu ketma-ketlikni DNK ichiga CRISPR deb ataladigan, DNKni tahrirlashga qodir tizim orqali joylashtirishdi. So‘ng DNKni qayta sekvenslashdi (resequencing) va quyida ko‘rayotgan gif’ni qayta tiklashdi.

Bu juda ta’sirli, lekin mahkamroq o‘tirib oling. Biz buni amalda ham ko‘ra olamiz! To‘g‘ri, aynan shu misolni emas, lekin boshqa bir guruh olimlar yuqori tezlikdagi atomic force microscopy yordamida bu qanday ishlashini ko‘rsatgan. Bu turdagi mikroskopiya skan qurilmasiga mexanik ulangan o‘tkir uchdan foydalanadi. Uchin sirt bilan o‘zaro ta’siri namunaning topologik tavsifini yaratadi. Bularning hammasi nanoscale darajada bo‘ladi. Quyidagi video CRISPR-Cas9 tizimi, ya’ni DNK “editori”, birinchi qadamda DNKni “chaynab” boshlayotganini ko‘rsatadi. Mazali!

CRISPR-Cas9 DNKni “chaynashi”. https://doi.org/10.1038/s41467-017-01466-8 manbasidan moslashtirilgan

Bundan ham ko‘proq. Olimlar DNKni qanday tasvirlashini o‘ylab ko‘rganmisiz? Ishoning yoki ishonmang, bu jarayon ham tasvirga olishni o‘z ichiga oladi. DNK ketma-ketligini bilish uchun olimlar avval uning nusxasini (copy) yaratishi kerak. Bu nusxalar nukleotidlarni (biz ATCG deb ataydigan narsalar) turli floresans bo‘yoqlar bilan belgilash (labeling) orqali yaratiladi. Har bir nukleotid ketma-ketlikka bittadan moslashtirib qo‘shiladi. Ular qo‘shilayotgan paytda kamera rasmga oladi. Qaysi rang yaltirayotganiga qarab, qaysi nukleotid qo‘shilgani aniqlanadi. Alohida lokatsiyalarni kuzatish orqali biz DNK molekulasining ketma-ketligini qayta tiklay olamiz. Bu sekvenslash texnologiyasi faqat tasvirlarni qayta tiklash bilan cheklanmaydi. U turli biologik jarayonlarni tushunishda ishlatiladi va klinik amaliyotlarda juda ko‘p qo‘llanadi. Shifokorlar bu ketma-ketliklardan turli ishlarni qila oladi. Masalan, o‘simta (tumor) namunasi sekvenslanib, uni agressiv yoki yo‘qligiga qarab klassifikatsiya qilishda ishlatilishi mumkin. Bu juda yuqori o‘lchamli (high-dimensional) data hosil qiladi. Bunday high-dimensional muhitda xulosa chiqarish qiyin, shuning uchun ko‘pincha uni 2D tasvirlarga kamaytirishadi. Bu 2D tasvirlar oddiy tasvirlar kabi qayta ishlanishi mumkin. Demak, siz uni CNN yordamida klassifikatsiya qilishingiz mumkin. Aql bovar qilmaydi, shundaymi?

Tasvir xususiyatlari uni olish usuliga bog‘liq

Tasvir turi qanday bo‘lishidan qat’i nazar, barcha tasvirlarda umumiy fundamental xususiyatlar bor. Ular fazoviy (spatial) komponentlarni ifodalaydi va odatda matritsalar ko‘rinishida tasvirlanadi. Lekin shuni tushunish muhim: barcha tasvirlar bir xil yaratilmaydi. Tasvirning o‘ziga xos xususiyatlari ham mavzu (subject matter)dan, ham tasvirni olish (acquisition) metodidan kelib chiqadi. Ya’ni, biz qora tuynuk va DNK bir xil ko‘rinishini kutmaymiz. Xuddi shuningdek, bir odamning fotosurati bilan uning rentgeni ham bir xil ko‘rinishini kutmaymiz.

Tasvir xususiyatlarini tushunish Computer Vision modeli qurishda juda yaxshi birinchi qadam. Faqat model ishlashiga ta’sir qilgani uchun emas, balki muammoingiz uchun qaysi modellarga mos kelishini ham belgilab bergani uchun. Muhimi, har bir tasvir turi uchun yangi neyron tarmoq arxitekturasi ishlab chiqish shart emas. Ba’zan mavjud modelni fine-tuning qilish yoki oxirgi qatlamini (last layer) o‘zgartirib, boshqa vazifa uchun moslab olish mumkin. Ba’zan esa bunday o‘zgartirish ham kerak bo‘lmaydi; aksincha, preprocessing qilinadi, ya’ni tasvirni tarmoq o‘qitilgan input’ga o‘xshatib beriladi. Hozir bu detallar haqida juda ko‘p bosh qotirmang, keyingi postlarida yoritamiz. Bu yerda ularni tilga olishdan maqsad tasvir qanday kontekstda olingani nega muhimligini tushuntirish.

Bir xil koordinata tizimida, lekin turli to‘lqin uzunliklarida olingan tasvirlar uchun, har bir acquisition’ni alohida rang kanali (color channel) sifatida ko‘rishning o‘zi kifoya bo‘lishi mumkin. Masalan, x-ray va near-infrared bilan birga olingan tasvirda ularni turli rang kanallari sifatida qarashingiz mumkin. Shunda har bir tasvir o‘zining alohida grayscale kanali bo‘ladi.

Bu oddiy ko‘rinsa ham, radar va ultratovush kabi ayrim texnologiyalar polar grid deb ataladigan boshqa koordinata tizimidan foydalanadi. Bu grid signal chiqadigan markazdan boshlanadi. Cartesian tizimdan farqli ravishda, piksel o‘lchami doimiy emas. Markazdan uzoqlashgan sari koordinatalar kattalashadi. Amaliy jihatdan bu shuni anglatadiki, masofa ortgani sayin piksellar kattaroq maydonni ifodalay boshlaydi. Bu yerda ikki yondashuv bor. Birinchisi koordinata tizimini piksellari bir xil o‘lchamli bo‘lgan tizimga o‘zgartiradi. Bu esa ko‘p “bo‘sh” (missing) ma’lumot hosil qiladi, qiziq bo‘lmasligi mumkin va saqlash (storage) tizimini ham optimal bo‘lmagan holatga olib kelishi ehtimol. Alternativa esa tasvirni o‘sha holicha qoldirib, markazdan masofani model uchun qo‘shimcha input sifatida berish.

Koordinata tizimi rol o‘ynaydigan yagona holat bu emas. Yana biri sun’iy yo‘ldosh (satellite) tasvirlari. Bir xil koordinatalarda olingan bir nechta to‘lqin uzunliklari bo‘lsa, avvalgidek ularni turli rang kanallari sifatida ko‘rish mumkin. Lekin data turli koordinata tizimlarida bo‘lsa, ish murakkablashadi. Masalan, satellite tasvirlar bilan Yerning boshqa turdagi tasviri bir vazifa uchun birlashtirilayotgan bo‘lsa. Bunday holatda koordinatalar bir-biriga moslab qayta xaritalanishi (remap) kerak bo‘ladi.

Oxirida, tasvirni olish jarayoni o‘zining bias’larini ham olib keladi. Bu yerda bias’ni dataset’ning istalmagan xususiyati sifatida erkin ta’riflaymiz: u yo shovqin (noise) bo‘lgani uchun, yo model xulqini o‘zgartirgani uchun zararli bo‘ladi. Bias manbalari ko‘p, lekin tasvirni olishda muhimlaridan biri measurement bias. Measurement bias modelni o‘qitish uchun ishlatilgan dataset bilan model real hayotda ko‘radigan dataset o‘rtasidagi farq juda katta bo‘lganda yuz beradi, masalan, yuqori aniqlikdagi mushukcha rasmi bilan nanny cam misolimizdagi kabi. Measurement bias boshqa manbalardan ham kelishi mumkin: masalan, label’lovchilarning o‘zidan (turli guruhlar va turli odamlar tasvirlarni turlicha label qiladi), yoki tasvir kontekstidan (masalan, it va mushukni klassifikatsiya qilishda, agar mushuk rasmlarining hammasi divanda bo‘lsa, model mushuk va itni emas, divan va divan emasni ajratishni o‘rganib qolishi mumkin).

Xulosa shuki: turli instrumentlardan olingan tasvirlarning xususiyatlarini bilib olish va ularni hisobga olish Computer Vision modeli qurishdagi birinchi qadam. Bu holatda aniqlagan muammolarimizni kamaytirish (mitigate) uchun preprocessing texnikalari va strategiyalarini qo‘llash mumkin.