8 iunie 2017
modul în care creierul recunoaște ceea ce vede ochiul
noua lucrare a Institutului Salk care prezintă procesul vizual al creierului ar putea îmbunătăți mașinile cu conducere automată și ar indica terapii pentru tulburări senzoriale
8 iunie 2017
LA JOLLA-dacă credeți că mașinile cu conducere automată nu pot ajunge aici destul de curând, nu sunteți singuri. Dar programarea computerelor pentru a recunoaște obiecte este foarte dificilă din punct de vedere tehnic, mai ales că oamenii de știință nu înțeleg pe deplin cum o fac propriile noastre creiere.
acum, cercetătorii Institutului Salk au analizat modul în care neuronii dintr-o parte critică a creierului, numită V2, răspund la scenele naturale, oferind o mai bună înțelegere a procesării vederii. Lucrarea este descrisă în Nature Communications pe 8 iunie 2017.
„înțelegerea modului în care creierul recunoaște obiectele vizuale este importantă nu numai de dragul vederii, ci și pentru că oferă o fereastră despre modul în care funcționează creierul în general”, spune Tatyana Sharpee, profesor asociat în laboratorul de Neurobiologie computațională al lui Salk și autor principal al lucrării. „O mare parte din creierul nostru este compus dintr-o unitate de calcul repetată, numită coloană corticală. În viziune, în special, putem controla intrările către creier cu o precizie deosebită, ceea ce face posibilă analizarea cantitativă a modului în care semnalele sunt transformate în creier.”
deși adesea luăm abilitatea de a vedea de la sine înțeles, această abilitate derivă din seturi de transformări matematice complexe pe care nu suntem încă capabili să le reproducem într-un computer, potrivit lui Sharpee. De fapt, mai mult de o treime din creierul nostru este dedicat exclusiv sarcinii de analiză a scenelor vizuale.
percepția noastră vizuală începe în ochi cu pixeli ușori și întunecați. Aceste semnale sunt trimise în partea din spate a creierului într-o zonă numită V1 unde sunt transformate pentru a corespunde marginilor din scenele vizuale. Cumva, ca urmare a mai multor transformări ulterioare ale acestor informații, putem recunoaște fețele, mașinile și alte obiecte și dacă acestea se mișcă. Cât de precis se întâmplă această recunoaștere este încă un mister, în parte pentru că neuronii care codifică obiectele răspund în moduri complicate.
acum, Sharpee și Ryan Rowekamp, un asociat de cercetare postdoctorală în grupul lui Sharpee, au dezvoltat o metodă statistică care ia aceste răspunsuri complexe și le descrie în moduri interpretabile, care ar putea fi folosite pentru a ajuta la decodarea vederii pentru viziunea simulată pe computer. Pentru a-și dezvolta modelul, echipa a folosit date disponibile publicului care arată răspunsurile creierului primatelor care vizionează filme cu scene naturale (cum ar fi peisajele forestiere) din Baza de date Collaborative Research in Computational Neuroscience (CRCNS).
„am aplicat noua noastră tehnică statistică pentru a ne da seama ce caracteristici din film au determinat neuronii V2 să-și schimbe răspunsurile”, spune Rowekamp. „Interesant, am descoperit că neuronii V2 răspundeau la combinații de margini.”
echipa a dezvăluit că neuronii V2 procesează informații vizuale în conformitate cu trei principii: în primul rând, combină marginile care au orientări similare, crescând robustețea percepției la mici schimbări în poziția curbelor care formează limitele obiectului. În al doilea rând, dacă un neuron este activat de o margine a unei anumite orientări și poziții, atunci orientarea la 90 de grade de la aceasta va fi supresivă în aceeași locație, o combinație denumită „suprimarea orientării încrucișate.”Aceste combinații de margini orientate transversal sunt asamblate în diferite moduri pentru a ne permite să detectăm diferite forme vizuale. Echipa a constatat că orientarea încrucișată a fost esențială pentru detectarea exactă a formei. Al treilea principiu este că modelele relevante se repetă în spațiu în moduri care pot ajuta la perceperea suprafețelor texturate ale copacilor sau apei și a limitelor dintre ele, ca în picturile impresioniste.
cercetătorii au încorporat cele trei principii de organizare într-un model pe care l-au numit modelul convoluțional Pătratic, care poate fi aplicat altor seturi de date experimentale. Procesarea vizuală este probabil similară cu modul în care creierul procesează mirosurile, atingerea sau sunetele, spun cercetătorii, astfel încât lucrarea ar putea elucida și prelucrarea datelor din aceste zone.
„modelele la care lucrasem înainte nu erau pe deplin compatibile cu datele sau nu erau compatibile curat”, spune Rowekamp. „Așadar, a fost cu adevărat satisfăcător când ideea de a combina recunoașterea marginilor cu sensibilitatea la textură a început să dea roade ca un instrument de analiză și înțelegere a datelor vizuale complexe.”
dar aplicarea mai imediată ar putea fi îmbunătățirea algoritmilor de recunoaștere a obiectelor pentru mașinile cu conducere automată sau alte dispozitive robotizate. „Se pare că de fiecare dată când adăugăm elemente de calcul care se găsesc în creier algoritmilor de viziune computerizată, performanța lor se îmbunătățește”, spune Sharpee.
lucrarea a fost finanțată de Fundația Națională pentru științe și Institutul Național pentru ochi.