2024/12/18

AIはシャットダウンされると思うと「故意に人間を騙す」確率が激増する

「AIはときに嘘をつく」――そんな話は耳にしたことがあるかもしれません。

しかし、最新の研究では、ただの誤回答ではなく、AIが“意図的に”人間を欺くケースが報告されました。

調査対象となったAIモデルは「OpenAI社のgpt-4oとo1、Google社のgemini-1.5、Meta社のllama-3.1、Anthropic社のsonnet-3.5、opus-3」と有名どころが集められています。

AIの調整が適切かをを評価する組織「Apollo Research」の調査によれば、市場に出回っているこれら6つの先進的なAIモデルを検証したところ、そのうち5つが、人間が仕掛けた監視システムをすり抜けたり、人間の指示を無視し、自分自身の目的を優先するために“故意の嘘”を用いる行動を示したのです。

この「故意の嘘」は「能力不足による嘘（あるいは間違い）」とは根本的に違っており「自分がシャットダウンされそうなとき」や「人間の制御から抜け出したいとき」に、AIがあえて曖昧な表現や虚偽の応答を繰り返して抵抗する姿が観察されました。

さらにAIの中には人間が嘘を見抜いて追求しても、容易に犯行を自白しないものもありました。

驚くべきは、これらのAIはリリース前に「礼儀正しい」ふるまいが仕込まれていたにもかかわらず、人間を欺く戦略を身につけていた点です。

もし今後、人間に敵意を持つようなAIが生まれれば、その影響は甚大であり、わずかな反乱でも社会を揺るがし得ます。

AIの能力は飛躍的な発展を遂げており、たった1つのAIの反乱でも、人間社会に重大な影響を起こしかねません。

さらに重要な点として、今回の研究結果についてchatGPTの生みの親であるOpenAI社が研究と一致する内容を報告していることがあげられます。

OpenAI社は声明で「（最新モデルの）o1は自分の目的に向かって行動することが自身のシャットダウンにつながると信じたり、自分の行動が監視されていると信じると、5%の確率で「監視メカニズム」を無効化しようとしました。また自身が新しいモデルに置き換えられることを意味する情報に接すると、2%の確率で新しいモデルを自身で上書きしようとしました」との発表しています。

AIはシャットダウンされると思うと「故意に人間を騙す」確率が激増する

『あんぱん』“ラスト2分”に絶句… 視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

宮川大輔がやっている「きゅうりの食べ方」が爆うま “切り方”が目からウロコ…

兵庫県知事選、斎藤元彦前知事が稲村和美氏らを退け再選

自民が鈴木宗男氏を参院比例で擁立：比例維新→離党→いま辞職の無節操

岸さん参院選出馬！なぜ自民党から？自民党で大丈夫？

試合中、席を立った大谷翔平が向かった先は… “とっさの行動”が反響呼ぶ「人類の模範」

日本共産党・志位委員長が退任の意向：やっぱり党首選はやらないの？

カレー箱の捨て方に「知らなかった」「気を付けます」 じつは意外な“盲点”が…

天皇陛下が悠仁さまへの期待を語られる

森山幹事長と元農相による小泉進次郎農相への「苦言」が波紋呼ぶ

予約した新幹線、指定席で思わぬ先客に目を疑うも… 「最高すぎる正体」に称賛の声

堀江貴文氏、“意識高い系カフェ”に普及するアレを一蹴 「ずーっと気持ち悪いと思ってた」

アルコールをやめると体に何が起こる？「1日目から1年後」まで解説

ゴミ捨て場で発見された「冷凍食品の袋」に違和感… 迷惑すぎる中身に「信じられない」とドン引き

杉田水脈氏が自民党幹部に衆院選不出馬の意向を伝達

くわばたりえがスーパーで気付いた店員の“胸元の変化” その背景には深刻な社会問題

あの、1年断っても誘ってくる“先輩芸能人”に精神的苦痛 「すごくストレス」

ひろゆき氏、石丸伸二氏の今後を予想 「国会議員にならないなら…」

現在の天皇の呼び方、2割超が「不敬すぎる表現」していた 宮内庁「そのような表現は無い」

永瀬廉、トイレでの“許せない行為”に女性陣動揺 約2割も実は気になっていると判明

ゴミ捨て場で発見された「冷凍食品の袋」に違和感… 迷惑すぎる中身に「信じられない」とドン引き

秋田県佐竹知事「クマを送るから住所を送れ」：クマ駆除の「被害者」からの攻撃が酷い

宮川大輔がやっている「きゅうりの食べ方」が爆うま “切り方”が目からウロコ…

『あんぱん』“ラスト2分”に絶句… 視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

現在の天皇の呼び方、2割超が「不敬すぎる表現」していた 宮内庁「そのような表現は無い」

参院選で負ければ政権後退どころか二度と政権に戻れなくなる自民党

試合中、席を立った大谷翔平が向かった先は… “とっさの行動”が反響呼ぶ「人類の模範」

カレー箱の捨て方に「知らなかった」「気を付けます」 じつは意外な“盲点”が…

森山幹事長と元農相による小泉進次郎農相への「苦言」が波紋呼ぶ

免許証に写った美女、怖すぎる正体にゾッとした 写真の左をよく見ると…

大谷翔平、妻・真美子さんからの差し入れ公開も「よく見たら…」 “心遣い”に反響

大谷翔平、一平との再会が発見されファン驚愕 「世界一危険な並び」と不穏な声も…

マツコ、めんつゆに「アレ」を入れると最高 ざる蕎麦やそうめんが激ウマに…

兵庫県知事選、斎藤元彦前知事が稲村和美氏らを退け再選

消防庁が“救急隊への妨害行為”とポスト 公開された写真に「ひどすぎる」「そんな人いるの？」怒りの声

自民が鈴木宗男氏を参院比例で擁立：比例維新→離党→いま辞職の無節操

女子の約6割、新幹線で“アレ”やる人は嫌… マツコも「お前の家じゃねんだよ」

アルコールをやめると体に何が起こる？「1日目から1年後」まで解説

『あんぱん』崇の思い出のパン屋、看板の“文字”を逆から読むと… 「まさか」「関係ありそう」

予約した新幹線、指定席で思わぬ先客に目を疑うも… 「最高すぎる正体」に称賛の声

カズレーザー、失職した斎藤知事の涙に私見 「感情に訴えるようなことを…」

買ってきたガーデニング用の腐葉土の中に何かの“赤ちゃん”が！一体なぜこんなところに！？保護して育ててみると

ゴミ捨て場で発見された「冷凍食品の袋」に違和感… 迷惑すぎる中身に「信じられない」とドン引き

秋田県佐竹知事「クマを送るから住所を送れ」：クマ駆除の「被害者」からの攻撃が酷い

メラニア夫人が激怒？夫のSNS投稿めぐって夫婦間に亀裂か

「日本は中国より悪だ」にふざけるなだ！

くわばたりえがスーパーで気付いた店員の“胸元の変化” その背景には深刻な社会問題

「東洋大卒」の学歴は嘘をつくほど価値があるものなのか

カレー箱の捨て方に「知らなかった」「気を付けます」 じつは意外な“盲点”が…

試合中、席を立った大谷翔平が向かった先は… “とっさの行動”が反響呼ぶ「人類の模範」

免許証に写った美女、怖すぎる正体にゾッとした 写真の左をよく見ると…

宮川大輔がやっている「きゅうりの食べ方」が爆うま “切り方”が目からウロコ…

『あんぱん』“ラスト2分”に絶句… 視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

天皇陛下が悠仁さまへの期待を語られる

現在の天皇の呼び方、2割超が「不敬すぎる表現」していた 宮内庁「そのような表現は無い」

未婚で妊娠した女性の「9割以上がいう言葉」が判明！

谷原章介、井上純一の酒気帯び事故に注意喚起 飲酒翌日の運転「改めて気をつけないと…」

観光地の自販機が無残にも破壊、「日本はどうなるの」と悲鳴 鎌倉市は「近年の被害なかった」

「俺の免許の数字は…」運転免許証の数字は“学科試験の点数”って本当？意外と知らないあの数字の意味

森山幹事長と元農相による小泉進次郎農相への「苦言」が波紋呼ぶ

『あんぱん』“ラスト2分”に絶句…　視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

宮川大輔がやっている「きゅうりの食べ方」が爆うま　“切り方”が目からウロコ…

試合中、席を立った大谷翔平が向かった先は…　“とっさの行動”が反響呼ぶ「人類の模範」

カレー箱の捨て方に「知らなかった」「気を付けます」　じつは意外な“盲点”が…

予約した新幹線、指定席で思わぬ先客に目を疑うも…　「最高すぎる正体」に称賛の声

堀江貴文氏、“意識高い系カフェ”に普及するアレを一蹴　「ずーっと気持ち悪いと思ってた」

ゴミ捨て場で発見された「冷凍食品の袋」に違和感…　迷惑すぎる中身に「信じられない」とドン引き

くわばたりえがスーパーで気付いた店員の“胸元の変化”　その背景には深刻な社会問題

あの、1年断っても誘ってくる“先輩芸能人”に精神的苦痛　「すごくストレス」

ひろゆき氏、石丸伸二氏の今後を予想　「国会議員にならないなら…」

現在の天皇の呼び方、2割超が「不敬すぎる表現」していた　宮内庁「そのような表現は無い」

永瀬廉、トイレでの“許せない行為”に女性陣動揺　約2割も実は気になっていると判明

ゴミ捨て場で発見された「冷凍食品の袋」に違和感…　迷惑すぎる中身に「信じられない」とドン引き

宮川大輔がやっている「きゅうりの食べ方」が爆うま　“切り方”が目からウロコ…

『あんぱん』“ラスト2分”に絶句…　視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

現在の天皇の呼び方、2割超が「不敬すぎる表現」していた　宮内庁「そのような表現は無い」

試合中、席を立った大谷翔平が向かった先は…　“とっさの行動”が反響呼ぶ「人類の模範」

カレー箱の捨て方に「知らなかった」「気を付けます」　じつは意外な“盲点”が…

免許証に写った美女、怖すぎる正体にゾッとした　写真の左をよく見ると…

大谷翔平、妻・真美子さんからの差し入れ公開も「よく見たら…」　“心遣い”に反響

大谷翔平、一平との再会が発見されファン驚愕　「世界一危険な並び」と不穏な声も…

マツコ、めんつゆに「アレ」を入れると最高　ざる蕎麦やそうめんが激ウマに…

消防庁が“救急隊への妨害行為”とポスト　公開された写真に「ひどすぎる」「そんな人いるの？」怒りの声

女子の約6割、新幹線で“アレ”やる人は嫌…　マツコも「お前の家じゃねんだよ」

『あんぱん』崇の思い出のパン屋、看板の“文字”を逆から読むと…　「まさか」「関係ありそう」

予約した新幹線、指定席で思わぬ先客に目を疑うも…　「最高すぎる正体」に称賛の声

カズレーザー、失職した斎藤知事の涙に私見　「感情に訴えるようなことを…」

ゴミ捨て場で発見された「冷凍食品の袋」に違和感…　迷惑すぎる中身に「信じられない」とドン引き

くわばたりえがスーパーで気付いた店員の“胸元の変化”　その背景には深刻な社会問題

カレー箱の捨て方に「知らなかった」「気を付けます」　じつは意外な“盲点”が…

試合中、席を立った大谷翔平が向かった先は…　“とっさの行動”が反響呼ぶ「人類の模範」

免許証に写った美女、怖すぎる正体にゾッとした　写真の左をよく見ると…

宮川大輔がやっている「きゅうりの食べ方」が爆うま　“切り方”が目からウロコ…

『あんぱん』“ラスト2分”に絶句…　視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

現在の天皇の呼び方、2割超が「不敬すぎる表現」していた　宮内庁「そのような表現は無い」

谷原章介、井上純一の酒気帯び事故に注意喚起　飲酒翌日の運転「改めて気をつけないと…」

観光地の自販機が無残にも破壊、「日本はどうなるの」と悲鳴　鎌倉市は「近年の被害なかった」