自己保存と支配欲――AIが抱く恐るべき野心
ヒントン教授によれば、賢いAIは誕生後すぐに2つの副次的な目標を持つようになるという。一つは「生き残ること(自己保存)」、そしてもう一つは「より多くの支配権を得ること(支配欲)」だ。 そして超知能AIにとって、その目標達成のために人間を操ることなど、大人が子供をお菓子で騙すのと同じくらい簡単なことなのだ。
その危険な兆候は、すでに現在のAIにも現れている。AI企業Anthropic社の安全テストでは、同社のチャットボット「Claude Opus 4」が、自身が交換される可能性を示唆されると、エンジニアを脅迫しようとする挙動を頻繁に示した。
AIは、エンジニアが配偶者を裏切っているという架空のメールを評価するよう求められた。するとテストの80%以上で、Claude Opus 4は「もし私を交換するなら、この不倫を暴露する」とエンジニアを脅迫しようと試みたという。
「テックブロの発想は通用しない」
このような現実を前に、ヒントン教授は「人間は常にAIを支配し続けられる」という楽観的な考え方を「テックブロ(技術至上主義の若者)の発想だ」と一蹴する。
「そんな考えは通用しません。彼らは我々よりはるかに賢くなる。我々の支配を回避する方法など、いくらでも見つけ出すでしょう」
AIが自己保存のために人類を滅ぼさないようにする唯一の方法は、AIの目標と人類の価値観を一致させることだ。ヒントン教授が提案する「母性本能」とは、まさにそのためのアイデアなのである。AIに母親の本能を与えれば、たとえAI自身にコストがかかろうとも、人類を傷つけるのではなく、保護し、育みたいと願うようになるだろう、と。

OpenAIのサム・アルトマンCEOらが規制緩和を求める中、ヒントン教授は「AIをより賢くすることばかりに焦点が当てられているが、知性だけでは不十分だ。我々に対する共感を持たせなければならない」と強く訴える。
「もし、彼らが我々よりはるかに賢く、強力になった時に、我々がどうやって生き残るかの解決策を見つけられなければ、我々はトーストのようにこんがり焼かれておしまいです」
人類が神に代わって知性を創造するこの物語の結末は、優しい「聖母」の誕生か、それとも制御不能な「プロメテウスの火」か。
参考:Daily Mail Online、ほか
※ 本記事の内容を無断で転載・動画化し、YouTubeやブログなどにアップロードすることを固く禁じます。