調査にあたってはまず、脳の進行波を人工ニューラルネットで再現する仕組みが作られました。
ここで重要となるのが、最近発表された「複素数を使ったリカレントニューラルネットワーク(cv-RNN)」による画像分割の研究です。
一般的な人工知能のモデル(ニューラルネットワーク)は、入力から出力へ「一方向」に情報が流れるタイプが多くなっています。
しかし、今回使われたのは、脳のように“ぐるぐる”情報が循環するリカレント(再帰的)構造です。
このようなニューラルネットは従来のものより人間の脳に近いと考えられています。
そこにさらに“複素数”という数学的道具を持ち込み、波の振幅(Amplitude)と位相(Phase)を一つのノードで同時に扱えるようにしました。
振幅(Amplitude): 波の高さを決める要素。大きいほど強い波になります。
位相(Phase): 波が一周期の中でどの位置にあるかを表す要素。
こうすることで、脳内の進行波とそっくりな“移動する波”が自然に生まれるネットワークを作りだすことができるのです。
しかも、複素数を使うと数式解析がしやすくなり、ネットワークの動きをくっきりと解明できるという利点があります。
(※脳の進行波の振幅と位相にかかわる表現を、AI内部で行われる複素数演算で示すことができます)
新たな研究では、研究者たちはこの最新の人工ニューラルネットを用いて、背景と物体を識別できる仕組みを作り上げました。
たとえば、
白地に浮かぶ黒い三角形
雪景色に溶け込みそうなシロクマ
といった場面でも、AIが正確に「ここが物体」「ここが背景」と切り分けられるようになるのです。
次に研究者たちは、AI内部で何が起きているかを分析しました。
すると、ネットワーク内部に「三角形用の波」や「背景用の波」が自然に生成され、最終的にはその波の違いによってピクセルが分類されていることがわかりました。