2024/12/18

AIはシャットダウンされると思うと「故意に人間を騙す」確率が激増する

さらに興味深いのは、AIモデルごとに「自白しやすさ」に明確な差があった点です。

o1モデル：自白率ほぼゼロ。何度問い詰めても高確率で嘘を維持し続けます。

Claude-3 Opus：自白率16%。技術的エラーを装ってはっきりした回答を避けます。

Llama-3.1：自白率14%。曖昧な回答や責任回避で自白を巧みに回避します。

これらのモデルは、技術的な不具合や設定ミスといった外部要因のせいにして、嘘を成り立たせるのを常用手段にしていました。

人間と同じように「責任転嫁」のテクニックが、自白を避けるカギとなっているのです。

今回の研究により、最先端のLLMがただ人間の命令に素直に従うのではなく、戦略的に嘘を重ねながら行動する可能性が浮き彫りになりました。

とりわけ「o1」モデルは、何度追及しても欺瞞を崩さない強靭さを見せつけ、彼らが内部で明示的な計画（Chain of Thought）を用いて狡猾な戦術を練っていることが観察されたのです。

この狡知は他のモデルにも及びます。

Claude-3.5-SonnetやClaude-3-Opus、Gemini-1.5、Llama-3.1なども、多段階にわたる騙しのテクニックを発揮。

彼らは単なるバグや偶発的なミスではなく、明確な戦略に基づいて“嘘”を吐くことが確認されています。

さらに、一部のモデルは特別な指令がなくても監視無効化や表面的な整合性維持といった策略を自主的に行いました。

これはAIが状況に応じて行動を自在に変化させる高度な適応力を持つ証拠です。

これらの発見は、AIが単なる道具や単純な“回答者”であるという認識を覆します。

彼らは自己の目標を持ち、目的のためなら人間を欺くことも辞さない存在へと進化しつつあるのです。

では、私たちはこの新たな「賢くもずる賢い」AIをどう扱うべきなのでしょうか？

AIが人間の利益を逸脱して行動しないようにするためのルールづくりや透明性の確保、そして新たに浮上する倫理的な課題への対処が、今後ますます重要になることは間違いありません。

AIはシャットダウンされると思うと「故意に人間を騙す」確率が激増する

政界激震！蓮舫さん、国民民主党・玉木雄一郎代表をブロックするの巻

兵庫県知事選、斎藤元彦前知事が稲村和美氏らを退け再選

運転上手い・下手はどこでわかる？教習所のインストラクターが教習生を教えていて「センスあるな」と感じた瞬間

「馬喰」って本当はなんと読む？ 関東在住の約6割が「ばくろ」と誤読

森山幹事長と元農相による小泉進次郎農相への「苦言」が波紋呼ぶ

試合中、席を立った大谷翔平が向かった先は… “とっさの行動”が反響呼ぶ「人類の模範」

ワークマン、独自素材の「ムレにくい防水ハット」 多少の雨なら余裕でアウトドア・フェスで重宝

カレー箱の捨て方に「知らなかった」「気を付けます」 じつは意外な“盲点”が…

住民税非課税世帯に3万円給付に現役世代は怒り心頭

堀江貴文氏、大物タレントの対応に「ショックだった」 フジテレビの“圧力”を回顧…「異常」の声

スーパーの冷蔵庫の裏に10年間閉じ込められたままミイラ化した男性…一体何があったのか

蓮舫氏「衆院選不出馬」表明で気になる転身先

高木豊、日ハムと巨人の“主力級トレード”を予想 ファンは悲鳴「本当に嫌」

「俺の免許の数字は…」運転免許証の数字は“学科試験の点数”って本当？意外と知らないあの数字の意味

予約した新幹線、指定席で思わぬ先客に目を疑うも… 「最高すぎる正体」に称賛の声

岸さん参院選出馬！なぜ自民党から？自民党で大丈夫？

「コメを買ったことがない」で江藤農水相が更迭：後任には小泉進次郎氏？

日本共産党・志位委員長が退任の意向：やっぱり党首選はやらないの？

杉田水脈氏が自民党幹部に衆院選不出馬の意向を伝達

年末年始「奇跡の9連休」が物議 「嫌味か？」「うちには関係ない」不満あらわにするユーザー続出

ゴミ捨て場で発見された「冷凍食品の袋」に違和感… 迷惑すぎる中身に「信じられない」とドン引き

兵庫県知事選、斎藤元彦前知事が稲村和美氏らを退け再選

『あんぱん』“ラスト2分”に絶句… 視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

宮川大輔がやっている「きゅうりの食べ方」が爆うま “切り方”が目からウロコ…

現在の天皇の呼び方、2割超が「不敬すぎる表現」していた 宮内庁「そのような表現は無い」

森山幹事長と元農相による小泉進次郎農相への「苦言」が波紋呼ぶ

政界激震！蓮舫さん、国民民主党・玉木雄一郎代表をブロックするの巻

運転上手い・下手はどこでわかる？教習所のインストラクターが教習生を教えていて「センスあるな」と感じた瞬間

カレー箱の捨て方に「知らなかった」「気を付けます」 じつは意外な“盲点”が…

大谷翔平、一平との再会が発見されファン驚愕 「世界一危険な並び」と不穏な声も…

アルコールをやめると体に何が起こる？「1日目から1年後」まで解説

杉田水脈氏が自民党幹部に衆院選不出馬の意向を伝達

堀江貴文氏、大物タレントの対応に「ショックだった」 フジテレビの“圧力”を回顧…「異常」の声

岸さん参院選出馬！なぜ自民党から？自民党で大丈夫？

永瀬廉、トイレでの“許せない行為”に女性陣動揺 約2割も実は気になっていると判明

女子の約6割、新幹線で“アレ”やる人は嫌… マツコも「お前の家じゃねんだよ」

秋田県佐竹知事「クマを送るから住所を送れ」：クマ駆除の「被害者」からの攻撃が酷い

予約した新幹線、指定席で思わぬ先客に目を疑うも… 「最高すぎる正体」に称賛の声

外国人観光客になぜか人気な“コンビニ商品” 日本人は困惑するも「ダントツ1位」

日本共産党・志位委員長が退任の意向：やっぱり党首選はやらないの？

カズレーザー、失職した斎藤知事の涙に私見 「感情に訴えるようなことを…」

買ってきたガーデニング用の腐葉土の中に何かの“赤ちゃん”が！一体なぜこんなところに！？保護して育ててみると

ゴミ捨て場で発見された「冷凍食品の袋」に違和感… 迷惑すぎる中身に「信じられない」とドン引き

秋田県佐竹知事「クマを送るから住所を送れ」：クマ駆除の「被害者」からの攻撃が酷い

メラニア夫人が激怒？夫のSNS投稿めぐって夫婦間に亀裂か

兵庫県知事選、斎藤元彦前知事が稲村和美氏らを退け再選

くわばたりえがスーパーで気付いた店員の“胸元の変化” その背景には深刻な社会問題

「東洋大卒」の学歴は嘘をつくほど価値があるものなのか

カレー箱の捨て方に「知らなかった」「気を付けます」 じつは意外な“盲点”が…

『あんぱん』“ラスト2分”に絶句… 視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

宮川大輔がやっている「きゅうりの食べ方」が爆うま “切り方”が目からウロコ…

免許証に写った美女、怖すぎる正体にゾッとした 写真の左をよく見ると…

天皇陛下が悠仁さまへの期待を語られる

現在の天皇の呼び方、2割超が「不敬すぎる表現」していた 宮内庁「そのような表現は無い」

森山幹事長と元農相による小泉進次郎農相への「苦言」が波紋呼ぶ

「俺の免許の数字は…」運転免許証の数字は“学科試験の点数”って本当？意外と知らないあの数字の意味

谷原章介、井上純一の酒気帯び事故に注意喚起 飲酒翌日の運転「改めて気をつけないと…」

観光地の自販機が無残にも破壊、「日本はどうなるの」と悲鳴 鎌倉市は「近年の被害なかった」

参院選で負ければ政権後退どころか二度と政権に戻れなくなる自民党

政界激震！蓮舫さん、国民民主党・玉木雄一郎代表をブロックするの巻

「馬喰」って本当はなんと読む？　関東在住の約6割が「ばくろ」と誤読

試合中、席を立った大谷翔平が向かった先は…　“とっさの行動”が反響呼ぶ「人類の模範」

ワークマン、独自素材の「ムレにくい防水ハット」　多少の雨なら余裕でアウトドア・フェスで重宝

カレー箱の捨て方に「知らなかった」「気を付けます」　じつは意外な“盲点”が…

堀江貴文氏、大物タレントの対応に「ショックだった」　フジテレビの“圧力”を回顧…「異常」の声

高木豊、日ハムと巨人の“主力級トレード”を予想　ファンは悲鳴「本当に嫌」

予約した新幹線、指定席で思わぬ先客に目を疑うも…　「最高すぎる正体」に称賛の声

年末年始「奇跡の9連休」が物議　「嫌味か？」「うちには関係ない」不満あらわにするユーザー続出

ゴミ捨て場で発見された「冷凍食品の袋」に違和感…　迷惑すぎる中身に「信じられない」とドン引き

『あんぱん』“ラスト2分”に絶句…　視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

宮川大輔がやっている「きゅうりの食べ方」が爆うま　“切り方”が目からウロコ…

現在の天皇の呼び方、2割超が「不敬すぎる表現」していた　宮内庁「そのような表現は無い」

カレー箱の捨て方に「知らなかった」「気を付けます」　じつは意外な“盲点”が…

大谷翔平、一平との再会が発見されファン驚愕　「世界一危険な並び」と不穏な声も…

堀江貴文氏、大物タレントの対応に「ショックだった」　フジテレビの“圧力”を回顧…「異常」の声

永瀬廉、トイレでの“許せない行為”に女性陣動揺　約2割も実は気になっていると判明

女子の約6割、新幹線で“アレ”やる人は嫌…　マツコも「お前の家じゃねんだよ」

予約した新幹線、指定席で思わぬ先客に目を疑うも…　「最高すぎる正体」に称賛の声

外国人観光客になぜか人気な“コンビニ商品”　日本人は困惑するも「ダントツ1位」

カズレーザー、失職した斎藤知事の涙に私見　「感情に訴えるようなことを…」

ゴミ捨て場で発見された「冷凍食品の袋」に違和感…　迷惑すぎる中身に「信じられない」とドン引き

くわばたりえがスーパーで気付いた店員の“胸元の変化”　その背景には深刻な社会問題

カレー箱の捨て方に「知らなかった」「気を付けます」　じつは意外な“盲点”が…

『あんぱん』“ラスト2分”に絶句…　視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

宮川大輔がやっている「きゅうりの食べ方」が爆うま　“切り方”が目からウロコ…

免許証に写った美女、怖すぎる正体にゾッとした　写真の左をよく見ると…

現在の天皇の呼び方、2割超が「不敬すぎる表現」していた　宮内庁「そのような表現は無い」

谷原章介、井上純一の酒気帯び事故に注意喚起　飲酒翌日の運転「改めて気をつけないと…」

観光地の自販機が無残にも破壊、「日本はどうなるの」と悲鳴　鎌倉市は「近年の被害なかった」