研究者はこのLlamaという言語理解力に優れたAIを「心理学的にチューニング(ファインチューニング)」することで、人間らしさを備えたAI「ケンタウル」を誕生させることに成功したのです。
ケンタウルが完成した後、実際にどれくらい人間のように振る舞えるのかを調べるため、いくつものテストが行われました。
その結果、ケンタウルは非常に優れた成果を示しました。
①とにかく人間に似た選択をする:専門的な心理学理論をもとに開発された従来の予測モデルと比較すると、ケンタウルの精度の高さは明らかでした。32種類のテスト課題が行われましたが、ケンタウルはそのうちたった1つを除く全ての課題で、専門の心理学モデルよりも高い精度で人間の行動を予測したのです。これは特定の問題に特化した専門モデルよりも、多くの状況から学んだケンタウルのような汎用モデルの方が、人間の行動をよりよく理解できる可能性を示しています。
②間違えもより人間らしい:また興味深いのは、ケンタウルが「人間らしい誤り」さえ模倣したという点です。言語タスクのベンチマークテストでは、元になったAIモデル(Llama)よりも、人間が陥りがちな「間違った答え」や「ウソを信じてしまう傾向」まで忠実に再現しました。完璧に正解を出すAIではなく、人間がつい犯してしまう誤りまで含めて模倣することは、人間らしさという観点で非常に重要な要素でしょう。
③新しい状況でも人間っぽい選択をする:またケンタウルは、今まで一度も経験したことがない未知の課題に対しても、人間に近い柔軟な対応力を示しました。例えば、ある課題で「宇宙船で宝探しをする」という設定を「魔法の絨毯に乗って冒険する」という全く別のシナリオに変えても、人間のように行動を予測しました。さらにケンタウルは、論理パズルや複雑な状況においても、人間がどのような選択をするのかを正しく予測することができたのです。これは、ケンタウルが単にデータを暗記するだけでなく、人間が持つ意思決定の「本質」や「戦略」のようなものを理解し始めている可能性を示しています。