ARC Prize Foundationで行われた研究によって、新たなベンチマーク「ARC-AGI-2」の衝撃的な結果が明らかになりました。

これまで、人工知能(AI)はチェスや囲碁など高度な専門領域で人間のトッププレイヤーを凌駕し、「人間のように幅広い課題に柔軟に対処できる汎用人工知能(AGI)」の実現へと近づいていると期待されてきました。

しかし今回のARC-AGI-2では、多くの先端AIモデルが軒並み低スコアにとどまり、“全滅状態”に近い結末を迎えたのです。

このテストは、従来の「難問を解く」タイプとは正反対に、「人間なら比較的簡単に対処できる」日常的・直感的なタスクに注目しており、実際に人間パネル(複数の被験者)の平均スコアが約60%だったのに対し、AIは一桁台の正答率に終始するケースが相次ぎました。

さらにどれだけ多額の計算リソースを投入しても正答率が伸びない“逆転現象”も目立ち、「AIは何でもできるわけではないのか?」と改めて問いを突きつけています。

同時に、大規模計算ばかりに頼らず、新たな推論手法を開発する必要性が研究者コミュニティで一段と高まっているのです。

果たしてAI研究はここからどの方向へ進むのでしょうか?

目次

  • 知識量だけじゃ突破不能:AGIへの壁は高い
  • 高性能AIの“日常力”はゼロ?新テストが明かす意外な落とし穴
  • 人間なら当然の“省エネ思考”がAIを苦しめる

知識量だけじゃ突破不能:AGIへの壁は高い

知識量だけじゃ突破不能:AGIへの壁は高い
知識量だけじゃ突破不能:AGIへの壁は高い / Credit:Canva

チェスや将棋、そして囲碁など、人間にとって難解とされてきたボードゲームでAIが勝利を収めるたび、メディアは「AIが人間を超えた」と大きく取り上げてきました。

さらに画像認識や自然言語処理といった応用分野でも、深層学習(ディープラーニング)の登場によって飛躍的な性能向上が実現しています。