June8,2017
脳が目に見えるものを認識する方法
New Salk Institute脳の視覚プロセあなたが自動運転車がすぐにここに着くことができないと思うなら、あなたは一人ではありません。 しかし、オブジェクトを認識するためのコンピュータのプログラミングは、科学者が完全に私たち自身の脳がそれを行う方法を理解していない、特に
今、ソーク研究所の研究者は、V2と呼ばれる脳の重要な部分にあるニューロンが自然な場面にどのように反応するかを分析し、視覚処理のより良い理 この研究は、2017年6月8日のnature Communicationsに記載されています。
“脳が視覚的な物体をどのように認識するかを理解することは、視覚のためだけでなく、脳が一般的にどのように機能するかについての窓を提供す 「私たちの脳の多くは、皮質列と呼ばれる反復計算単位で構成されています。 特に視覚では、脳への入力を絶妙な精度で制御することができ、脳内の信号がどのように変換されるかを定量的に分析することが可能になります。”
私たちはしばしば当たり前のように見る能力を取るが、この能力は、我々はまだコンピュータで再現することができない複雑な数学的変換のセットに由来する、Sharpeeによると。 実際には、私たちの脳の三分の一以上は、視覚的なシーンを解析するタスクに専念しています。
私たちの視覚は、明るいピクセルと暗いピクセルで目から始まります。 これらの信号は、脳の後ろにV1と呼ばれる領域に送られ、そこで視覚的なシーンのエッジに対応するように変換されます。 どういうわけか、この情報のいくつかの後続の変換の結果として、我々はその後、顔、車や他のオブジェクトを認識し、それらが動いているかどうかを認識 オブジェクトをエンコードするニューロンが複雑な方法で応答するため、この認識がどのように正確に起こるかはまだ謎です。
さて、SharpeeとRyan Rowekamp、Sharpeeのグループのポスドク研究員は、これらの複雑な応答を取り、解釈可能な方法でそれらを記述する統計的方法を開発しました。 彼らのモデルを開発するために、チームは、計算神経科学(CRCNS)の共同研究データベースから自然のシーン(森林景観など)の映画を見て霊長類の脳応答を示す公
「私たちは、映画の中でどのような特徴がV2ニューロンの応答を変化させているのかを把握するために、新しい統計的手法を適用しました」とRowekamp氏は述 「興味深いことに、我々はV2ニューロンがエッジの組み合わせに応答していることを発見しました。”
研究チームは、V2ニューロンが視覚情報を3つの原則に従って処理することを明らかにしました。まず、同じ向きを持つエッジを結合し、物体の境界を形成する曲線の位置の小さな変化に対する知覚のロバスト性を高めます。 第二に、ニューロンが特定の向きおよび位置のエッジによって活性化される場合、それから90度の向きは同じ位置で抑制され、”交差方向抑制”と呼ばれる組「これらの交差方向のエッジの組み合わせは、さまざまな視覚的形状を検出できるように、さまざまな方法で組み立てられています。 チームは、正確な形状検出には交差方向が不可欠であることを発見しました。 第三の原則は、印象派の絵画のように、木や水の質感のある表面とそれらの間の境界を知覚するのに役立つ方法で、関連するパターンが空間で繰り返さ
研究者らは、3つの組織化原理を二次畳み込みモデルと名付けたモデルに組み込み、他の実験データのセットに適用することができます。 視覚処理は、脳がどのように匂い、触ったり、音を処理するかに似ている可能性が高いため、これらの領域からのデータの処理も解明できると研究者は言
「以前に取り組んでいたモデルは、データと完全に互換性がなかったり、きれいに互換性がなかったりしました」とRowekamp氏は言います。 “エッジ認識とテクスチャへの感度を組み合わせるというアイデアが、複雑な視覚データを分析して理解するツールとして報われ始めたとき、それは本当に満足していました。”
しかし、より直接的なアプリケーションは、自動運転車や他のロボットデバイスのオブジェクト認識アルゴリズムを改善することかもしれません。 「脳内にある計算要素をコンピュータビジョンアルゴリズムに追加するたびに、そのパフォーマンスが向上するようです」とSharpee氏は言います。
この研究は国立科学財団と国立眼研究所によって資金提供された。