人工知能(AI)の進化は、これまでの人類の歴史と比較しても驚異的なスピードで進んでいる。そんなAIの知能を測るために新たに開発されたのが「Humanity’s Last Exam(人類最後の試験)」だ。この試験は、AIが人類の知識の極限まで到達できるかを評価する究極のテストとして設計されている。

■AIにとっての「究極のテスト」とは?

「Humanity’s Last Exam(HLE)」は、大規模言語モデル(LLM)に対して最も難しい問題を出題することで、その知能の限界を測ることを目的としている。これまでのAIは、単純な質問に対しては高い正答率を示してきたが、このHLEでは違う。数学、生物学、物理学、コンピューターサイエンス、人文学など、幅広い分野の専門家が考案した難問が用意されており、その中には古代ローマの碑文の翻訳や、ハチドリの特定の骨が支える腱の数を問うようなものまで含まれている。

 現在、さまざまなAIモデルがHLEに挑戦しているが、現時点での正答率はわずか3〜14%にとどまっている。しかし、専門家によると、2025年末までには50%以上の正答率に達する可能性があるという。

■AIは「確実な知識」を持つことができるのか?

 HLEの問題は、単なる知識の暗記では解答できないように設計されている。そのため、AIは単に「学習データから答えを導き出す」だけでなく、論理的な推論を行い、自らの回答の確信度を示す必要がある。これは、AIが従来の「データ検索エンジン」としての役割を超え、真の意味での知的存在へと進化するための試金石とも言える。

 また、AIが誤った回答を自信満々に提供することが大きな課題とされている。現在のLLMは、分からないことに対しても適当な答えを出すことがあるため、今後の開発では「不確実な場合に自信の度合いを調整できる能力」を持たせることが重要視されている。

■AIの進化は人類に何をもたらすのか?

 これまでの研究では、AIは驚異的な速度で学習し、新しい技術を短期間で習得してきた。例えば、囲碁の世界では「AlphaGo」がわずか数年で人類のトッププレイヤーを超えるほどに成長した。また、医療分野でもAIは病気の診断精度を飛躍的に向上させており、人間の専門家と肩を並べるほどになっている。

 しかし、HLEのような極めて難解な試験に合格することで、AIはさらに進化し、より深い推論能力を持つことが期待されている。もしAIがこの試験に合格できるようになれば、それは「人間の知識と同等、またはそれ以上の知能を持つAI」が誕生したことを意味するのかもしれない。

AIは「人類最後の試験」に合格できるのか? 2025年中に歴史が変わる瞬間が訪れる!?
(画像=『TOCANA』より 引用)