8. Června 2017
jak mozek rozpozná, co oko vidí
Nová práce Institutu Salk, která nastiňuje vizuální proces mozku, by mohla zlepšit samořiditelná auta a poukázat na terapie smyslového poškození
8. Června 2017
LA JOLLA-pokud si myslíte, že se sem samořiditelná auta nemohou dostat dostatečně brzy, nejste sami— Ale programování počítačů k rozpoznání objektů je velmi technicky náročné, zejména proto, že vědci plně nerozumí tomu, jak to dělají naše vlastní mozky.
nyní vědci Salk Institute analyzovali, jak neurony v kritické části mozku, nazývané V2, reagují na přirozené scény a poskytují lepší pochopení zpracování zraku. Práce je popsána v Nature Communications 8. Června 2017.
„pochopení toho, jak mozek rozpoznává vizuální objekty, je důležité nejen kvůli vidění, ale také proto, že poskytuje okno o tom, jak mozek funguje obecně,“ říká Tatyana Sharpee, docentka v Salkově výpočetní neurobiologické laboratoři a hlavní autor článku. „Velká část našeho mozku se skládá z opakované výpočetní jednotky, nazývané kortikální sloupec. Zejména ve vidění můžeme řídit vstupy do mozku s vynikající přesností, což umožňuje kvantitativně analyzovat, jak jsou signály transformovány v mozku.“
ačkoli často považujeme schopnost vidět za samozřejmost, tato schopnost pochází ze sad složitých matematických transformací, které ještě nejsme schopni reprodukovat v počítači, podle Sharpee. Ve skutečnosti je více než třetina našeho mozku věnována výhradně úloze analýzy vizuálních scén.
naše vizuální vnímání začíná v oku světlými a tmavými pixely. Tyto signály jsou odesílány do zadní části mozku do oblasti zvané V1, kde jsou transformovány tak, aby odpovídaly hranám ve vizuálních scénách. V důsledku několika následných transformací těchto informací pak můžeme rozpoznat tváře, auta a další objekty a to, zda se pohybují. Jak přesně se toto rozpoznávání děje, je stále záhadou, částečně proto, že neurony, které kódují objekty, reagují komplikovaně.
nyní Sharpee a Ryan Rowekamp, postdoktorand ve skupině Sharpee, vyvinuli statistickou metodu, která bere tyto složité odpovědi a popisuje je interpretovatelnými způsoby, které by mohly být použity k pomoci dekódovat vidění pro počítačem simulované vidění. K vývoji svého modelu tým použil veřejně dostupná data ukazující mozkové reakce primátů sledujících filmy přírodních scén (jako jsou lesní krajiny) z databáze Collaborative Research in Computational Neuroscience (CRCNS).
“ použili jsme naši novou statistickou techniku, abychom zjistili, jaké funkce ve filmu způsobují, že neurony V2 mění své reakce,“ říká Rowekamp. „Zajímavé je, že jsme zjistili, že V2 neurony reagovaly na kombinace hran.“
tým odhalil, že V2 neurony zpracovávají vizuální informace podle tří principů: za prvé, kombinují hrany, které mají podobné orientace, zvyšuje robustnost vnímání na malé změny polohy křivek, které tvoří hranice objektů. Druhý, pokud je neuron aktivován hranou určité orientace a polohy, pak orientace 90 stupňů od toho bude na stejném místě potlačující, kombinace nazývaná „potlačení křížové orientace.“Tyto křížově orientované kombinace hran jsou sestaveny různými způsoby, aby nám umožnily detekovat různé vizuální tvary. Tým zjistil, že křížová orientace je nezbytná pro přesnou detekci tvaru. Třetím principem je, že relevantní vzory se opakují v prostoru způsobem, který může pomoci vnímat texturované povrchy stromů nebo vody a hranice mezi nimi, jako v impresionistických malbách.
vědci začlenili tři organizační principy do modelu, který pojmenovali kvadratický konvoluční model,který lze aplikovat na jiné sady experimentálních dat. Vizuální zpracování bude pravděpodobně podobné tomu, jak mozek zpracovává pachy, dotyky nebo zvuky, říkají vědci, takže práce by mohla objasnit i zpracování dat z těchto oblastí.
„modely, na kterých jsem předtím pracoval, nebyly zcela kompatibilní s daty nebo nebyly čistě kompatibilní,“ říká Rowekamp. „Bylo tedy opravdu uspokojivé, když se myšlenka kombinace rozpoznávání hran s citlivostí na texturu začala vyplácet jako nástroj pro analýzu a porozumění komplexním vizuálním datům.“
ale bezprostřednější aplikací může být zlepšení algoritmů rozpoznávání objektů pro automobily s vlastním pohonem nebo jiná robotická zařízení. „Zdá se, že pokaždé, když přidáme prvky výpočtu, které se nacházejí v mozku, do algoritmů počítačového vidění, jejich výkon se zlepšuje,“ říká Sharpee.
práce byla financována Národní vědeckou nadací a národním očním Institutem.