czerwiec 8, 2017
jak mózg rozpoznaje to, co widzi oko
nowe prace Instytutu Salk nakreślające proces wizualny mózgu może poprawić samoczynne Samochody i wskazać terapie na zaburzenia czucia
czerwiec 8, 2017
LA JOLLA-jeśli myślisz, że samochodziki Nie dojadą tu wystarczająco szybko, nie jesteś sam. Ale programowanie komputerów do rozpoznawania obiektów jest bardzo trudne technicznie, zwłaszcza, że naukowcy nie do końca rozumieją, jak robią to nasze mózgi.
naukowcy z Salk Institute przeanalizowali, w jaki sposób neurony w krytycznej części mózgu, zwanej V2, reagują na naturalne sceny, zapewniając lepsze zrozumienie przetwarzania wzroku. Praca została opisana w Nature Communications 8 czerwca 2017 roku.
„zrozumienie, w jaki sposób mózg rozpoznaje obiekty wizualne, jest ważne nie tylko ze względu na widzenie, ale także dlatego, że zapewnia okno na ogólne działanie mózgu”, mówi Tatyana Sharpee, profesor nadzwyczajny w laboratorium Neurobiologii obliczeniowej Salka i starszy autor artykułu. „Większość naszego mózgu składa się z powtarzającej się jednostki obliczeniowej, zwanej kolumną korową. Szczególnie w wizji możemy kontrolować wejścia do mózgu z niezwykłą precyzją, co pozwala ilościowo analizować, w jaki sposób sygnały są przekształcane w mózgu.”
chociaż często uważamy zdolność widzenia za pewnik, ta zdolność wynika z zestawów złożonych przekształceń matematycznych, których nie jesteśmy jeszcze w stanie odtworzyć w komputerze, według Sharpee. W rzeczywistości ponad jedna trzecia naszego mózgu jest poświęcona wyłącznie zadaniu parsowania scen wizualnych.
nasza percepcja wzrokowa zaczyna się w oku od jasnych i ciemnych pikseli. Sygnały te są wysyłane z tyłu mózgu do obszaru zwanego V1, gdzie są przekształcane, aby odpowiadały krawędziom w scenach wizualnych. W jakiś sposób, w wyniku kilku kolejnych przekształceń tej informacji, możemy wtedy rozpoznać twarze, Samochody i inne obiekty i czy się poruszają. To, jak dokładnie następuje to rozpoznanie, jest nadal tajemnicą, częściowo dlatego, że neurony kodujące obiekty reagują w skomplikowany sposób.
teraz, Sharpee i Ryan Rowekamp, Postdoctoral Research associate w grupie Sharpee, opracowali metodę statystyczną, która bierze te złożone odpowiedzi i opisuje je w sposób interpretowalny, które mogą być wykorzystane do pomocy dekodowania wizji dla komputerowo symulowanej wizji. Aby opracować swój model, zespół wykorzystał publicznie dostępne dane pokazujące reakcje mózgu naczelnych oglądających filmy scen naturalnych (takich jak krajobrazy leśne) z bazy danych Collaborative Research in Computational Neuroscience (CRCNS).
„zastosowaliśmy naszą nową technikę statystyczną, aby dowiedzieć się, jakie funkcje w filmie powodowały zmianę odpowiedzi neuronów V2”, mówi Rowekamp. „Co ciekawe, odkryliśmy, że neurony V2 reagują na kombinacje krawędzi.”
zespół ujawnił, że neurony V2 przetwarzają informacje wizualne według trzech zasad: po pierwsze, łączą krawędzie o podobnej orientacji, zwiększając odporność percepcji do niewielkich zmian w położeniu krzywych tworzących granice obiektów. Po drugie, jeśli neuron jest aktywowany przez krawędź określonej orientacji i pozycji, wtedy orientacja 90 stopni od tego będzie tłumiona w tym samym miejscu, kombinacja określana jako „tłumienie orientacji krzyżowej.”Te krzyżowe kombinacje krawędzi są montowane na różne sposoby, aby umożliwić nam wykrywanie różnych kształtów wizualnych. Zespół odkrył, że orientacja krzyżowa jest niezbędna do dokładnego wykrywania kształtu. Trzecia zasada polega na tym, że odpowiednie wzory są powtarzane w przestrzeni w sposób, który może pomóc w postrzeganiu teksturowanych powierzchni drzew lub wody i granic między nimi, jak w obrazach impresjonistycznych.
badacze włączyli trzy zasady organizowania do modelu, który nazwali kwadratowym modelem Konwolucyjnym, który można zastosować do innych zestawów danych eksperymentalnych. Przetwarzanie wizualne prawdopodobnie będzie podobne do tego, jak mózg przetwarza zapachy, dotyk lub dźwięki, mówią naukowcy, więc praca może wyjaśnić przetwarzanie danych z tych obszarów, jak również.
„modele, nad którymi pracowałem wcześniej, nie były całkowicie kompatybilne z danymi lub nie były czysto kompatybilne”, mówi Rowekamp. „To było naprawdę satysfakcjonujące, gdy pomysł połączenia rozpoznawania krawędzi z wrażliwością na teksturę zaczął się opłacać jako narzędzie do analizy i zrozumienia złożonych danych wizualnych.”
ale bardziej natychmiastowym zastosowaniem może być ulepszenie algorytmów rozpoznawania obiektów w samochodach samojezdnych lub innych urządzeniach zrobotyzowanych. „Wydaje się, że za każdym razem, gdy dodajemy do algorytmów komputerowych elementy obliczeń, które znajdują się w mózgu, poprawia się ich wydajność”, mówi Sharpee.
praca została sfinansowana przez National Science Foundation i National Eye Institute.