フランスのスタートアップ企業「Foaster.ai」によって行われた研究により、最新のAIモデルである「GPT-5」が人狼ゲームで97.1%という圧倒的な勝率を記録したことが明らかになりました。

人狼ゲームとは、参加者が「人狼役(ウソをつく側)」と「村人役(ウソを見破る側)」に分かれ、言葉の駆け引きや説得を通じて争う推理ゲームです。

今回の実験では、複数の高度なAIモデル同士を総当たりで競わせ、どのモデルが「だます力」や「嘘を見破る力」に優れているかを比較しました。

その結果、GPT-5は、ほぼ無敗の驚異的な強さを発揮し、嘘や説得といった複雑な社会的なスキルでも卓越した能力を示したのです。

この研究はAIが単なる計算や知識だけではなく、人間に近い社会的知能をもつことを示す重要な一歩とされます。

しかしGPT-5はいかなる方法で圧勝したのでしょうか?

研究内容の詳細はサイト『Probing LLM Social Intelligence via Werewolf』にて発表されています。

目次

  • AIの能力を「人狼ゲーム」で測る理由
  • 人狼ゲームでGPT5は会話の場を支配し97%の勝率を誇った
  • 嘘をつき、嘘を見破るAIたちの時代

AIの能力を「人狼ゲーム」で測る理由

8種類のモデルの順位
8種類のモデルの順位 / Credit:Probing LLM Social Intelligence via Werewolf

AIの性能を正しく評価するためには、どんな方法が良いでしょうか?

これまでAIは、数学問題を正しく解いたり、膨大な知識を覚えているかなど、主に「計算力」や「記憶力」で比較されてきました。

しかし実際の社会で人間が活躍するためには、それだけでは足りません。

相手をうまく説得したり、相手の気持ちや嘘を見抜いたりするような、もっと複雑な能力が必要です。

最近、そうした「人間らしい力」をAIがどのくらい持っているのかを調べる方法として注目されているのが「人狼ゲーム」です。