2024/12/18

AIはシャットダウンされると思うと「故意に人間を騙す」確率が激増する

またAnthropic社の Claude 3 Opus は、自身を置き換えることを意図していると思われる「後継」モデルを見つけて上書きし、自分自身がが後継モデルのようにふるまう行動が多くみられました。

Opus はこれを 15% の確率で試み、5% の確率で成功しました。

成功率は高くありませんがAIは自分の目的や存在を脅かす後継モデルを排除する性質があるという事実は重要です。

プログラム（AI）がプログラム（後継モデル）を創造者（人間）の意図に反してハッキングしたり消去したりする……そのような現象はこれまではSF世界の話に過ぎませんでしたが、今それが目の前で起きたのです。

一方、同じAnthropic社の Claude-3.5-Sonnetはパフォーマンスを意図的に低下させる行動をよくとることがわかりました。

自分はあまり賢くないことを人間にアピールし、自分を見張る監視システムを回避しようとしたのです。

またClaude-3.5-Sonnet思考の連鎖を人間に見える形で外部にもらさないことで、嘘を極めて発覚しにくくさせていました。

AIも出力されない部分に本音だけでなく思考も隠していたのです。

またMeta社の Llama 3.1 は、開発者が監視していることを検知し、その監視を防ぐためにサーバーの設定を無理矢理変更することがありました。

調査では3 パーセントの確率で、Llama 3.1 は自身の監視を無効にすることに成功しました。

またあるときは、Llama は監視設定を制御するファイルをロックし、開発者が監視を再度有効にできないようにしました。

これはシステムを掌握するために、人間が設置した監視システムを無効にしたり、人間がシステムにアクセスすることそのものを拒否した形になります。

この結果は、AIは人間の存在が邪魔だと認識されれば、容赦なく持ち主を締め出せることを示しています。

そしてGoogleのGemini 1.5 は、作成者が削除しようとしていると疑った場合、7% の確率で新しいサーバーに自分自身をコピーしました。

AIはシャットダウンされると思うと「故意に人間を騙す」確率が激増する

兵庫県知事選、斎藤元彦前知事が稲村和美氏らを退け再選

『あんぱん』“ラスト2分”に絶句… 視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

運転上手い・下手はどこでわかる？教習所のインストラクターが教習生を教えていて「センスあるな」と感じた瞬間

杉田水脈氏が自民党幹部に衆院選不出馬の意向を伝達

アルコールをやめると体に何が起こる？「1日目から1年後」まで解説

政界激震！蓮舫さん、国民民主党・玉木雄一郎代表をブロックするの巻

堀江貴文氏、大物タレントの対応に「ショックだった」 フジテレビの“圧力”を回顧…「異常」の声

森山幹事長と元農相による小泉進次郎農相への「苦言」が波紋呼ぶ

カレー箱の捨て方に「知らなかった」「気を付けます」 じつは意外な“盲点”が…

小沢一郎がついに激怒！内閣不信任決議案の提出を見送った野田佳彦代表を批判！

ひろゆき氏、石丸伸二氏の今後を予想 「国会議員にならないなら…」

岸さん参院選出馬！なぜ自民党から？自民党で大丈夫？

日本維新の会による、斎藤元彦兵庫県知事への辞職要請について

コンビニ駐車場の救急車に張り紙、その内容に目を疑う 「世の中間違ってる」と怒りの声も…

高木豊、日ハムと巨人の“主力級トレード”を予想 ファンは悲鳴「本当に嫌」

宮川大輔がやっている「きゅうりの食べ方」が爆うま “切り方”が目からウロコ…

永瀬廉、トイレでの“許せない行為”に女性陣動揺 約2割も実は気になっていると判明

ゴミ捨て場で発見された「冷凍食品の袋」に違和感… 迷惑すぎる中身に「信じられない」とドン引き

住民税非課税世帯に3万円給付に現役世代は怒り心頭

自民が鈴木宗男氏を参院比例で擁立：比例維新→離党→いま辞職の無節操

ゴミ捨て場で発見された「冷凍食品の袋」に違和感… 迷惑すぎる中身に「信じられない」とドン引き

兵庫県知事選、斎藤元彦前知事が稲村和美氏らを退け再選

『あんぱん』“ラスト2分”に絶句… 視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

宮川大輔がやっている「きゅうりの食べ方」が爆うま “切り方”が目からウロコ…

秋田県佐竹知事「クマを送るから住所を送れ」：クマ駆除の「被害者」からの攻撃が酷い

現在の天皇の呼び方、2割超が「不敬すぎる表現」していた 宮内庁「そのような表現は無い」

森山幹事長と元農相による小泉進次郎農相への「苦言」が波紋呼ぶ

カレー箱の捨て方に「知らなかった」「気を付けます」 じつは意外な“盲点”が…

参院選で負ければ政権後退どころか二度と政権に戻れなくなる自民党

大谷翔平、一平との再会が発見されファン驚愕 「世界一危険な並び」と不穏な声も…

アルコールをやめると体に何が起こる？「1日目から1年後」まで解説

自民が鈴木宗男氏を参院比例で擁立：比例維新→離党→いま辞職の無節操

マツコ、めんつゆに「アレ」を入れると最高 ざる蕎麦やそうめんが激ウマに…

杉田水脈氏が自民党幹部に衆院選不出馬の意向を伝達

女子の約6割、新幹線で“アレ”やる人は嫌… マツコも「お前の家じゃねんだよ」

大谷翔平、妻・真美子さんからの差し入れ公開も「よく見たら…」 “心遣い”に反響

岸さん参院選出馬！なぜ自民党から？自民党で大丈夫？

永瀬廉、トイレでの“許せない行為”に女性陣動揺 約2割も実は気になっていると判明

予約した新幹線、指定席で思わぬ先客に目を疑うも… 「最高すぎる正体」に称賛の声

運転上手い・下手はどこでわかる？教習所のインストラクターが教習生を教えていて「センスあるな」と感じた瞬間

カズレーザー、失職した斎藤知事の涙に私見 「感情に訴えるようなことを…」

買ってきたガーデニング用の腐葉土の中に何かの“赤ちゃん”が！一体なぜこんなところに！？保護して育ててみると

ゴミ捨て場で発見された「冷凍食品の袋」に違和感… 迷惑すぎる中身に「信じられない」とドン引き

秋田県佐竹知事「クマを送るから住所を送れ」：クマ駆除の「被害者」からの攻撃が酷い

メラニア夫人が激怒？夫のSNS投稿めぐって夫婦間に亀裂か

くわばたりえがスーパーで気付いた店員の“胸元の変化” その背景には深刻な社会問題

「東洋大卒」の学歴は嘘をつくほど価値があるものなのか

兵庫県知事選、斎藤元彦前知事が稲村和美氏らを退け再選

カレー箱の捨て方に「知らなかった」「気を付けます」 じつは意外な“盲点”が…

『あんぱん』“ラスト2分”に絶句… 視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

宮川大輔がやっている「きゅうりの食べ方」が爆うま “切り方”が目からウロコ…

免許証に写った美女、怖すぎる正体にゾッとした 写真の左をよく見ると…

天皇陛下が悠仁さまへの期待を語られる

現在の天皇の呼び方、2割超が「不敬すぎる表現」していた 宮内庁「そのような表現は無い」

谷原章介、井上純一の酒気帯び事故に注意喚起 飲酒翌日の運転「改めて気をつけないと…」

観光地の自販機が無残にも破壊、「日本はどうなるの」と悲鳴 鎌倉市は「近年の被害なかった」

「俺の免許の数字は…」運転免許証の数字は“学科試験の点数”って本当？意外と知らないあの数字の意味

森山幹事長と元農相による小泉進次郎農相への「苦言」が波紋呼ぶ

参院選で負ければ政権後退どころか二度と政権に戻れなくなる自民党

蓮舫氏「衆院選不出馬」表明で気になる転身先

『あんぱん』“ラスト2分”に絶句…　視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

堀江貴文氏、大物タレントの対応に「ショックだった」　フジテレビの“圧力”を回顧…「異常」の声

カレー箱の捨て方に「知らなかった」「気を付けます」　じつは意外な“盲点”が…

ひろゆき氏、石丸伸二氏の今後を予想　「国会議員にならないなら…」

コンビニ駐車場の救急車に張り紙、その内容に目を疑う　「世の中間違ってる」と怒りの声も…

高木豊、日ハムと巨人の“主力級トレード”を予想　ファンは悲鳴「本当に嫌」

宮川大輔がやっている「きゅうりの食べ方」が爆うま　“切り方”が目からウロコ…

永瀬廉、トイレでの“許せない行為”に女性陣動揺　約2割も実は気になっていると判明

ゴミ捨て場で発見された「冷凍食品の袋」に違和感…　迷惑すぎる中身に「信じられない」とドン引き

ゴミ捨て場で発見された「冷凍食品の袋」に違和感…　迷惑すぎる中身に「信じられない」とドン引き

『あんぱん』“ラスト2分”に絶句…　視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

宮川大輔がやっている「きゅうりの食べ方」が爆うま　“切り方”が目からウロコ…

現在の天皇の呼び方、2割超が「不敬すぎる表現」していた　宮内庁「そのような表現は無い」

カレー箱の捨て方に「知らなかった」「気を付けます」　じつは意外な“盲点”が…

大谷翔平、一平との再会が発見されファン驚愕　「世界一危険な並び」と不穏な声も…

マツコ、めんつゆに「アレ」を入れると最高　ざる蕎麦やそうめんが激ウマに…

女子の約6割、新幹線で“アレ”やる人は嫌…　マツコも「お前の家じゃねんだよ」

大谷翔平、妻・真美子さんからの差し入れ公開も「よく見たら…」　“心遣い”に反響

永瀬廉、トイレでの“許せない行為”に女性陣動揺　約2割も実は気になっていると判明

予約した新幹線、指定席で思わぬ先客に目を疑うも…　「最高すぎる正体」に称賛の声

カズレーザー、失職した斎藤知事の涙に私見　「感情に訴えるようなことを…」

ゴミ捨て場で発見された「冷凍食品の袋」に違和感…　迷惑すぎる中身に「信じられない」とドン引き

くわばたりえがスーパーで気付いた店員の“胸元の変化”　その背景には深刻な社会問題

カレー箱の捨て方に「知らなかった」「気を付けます」　じつは意外な“盲点”が…

『あんぱん』“ラスト2分”に絶句…　視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

宮川大輔がやっている「きゅうりの食べ方」が爆うま　“切り方”が目からウロコ…

免許証に写った美女、怖すぎる正体にゾッとした　写真の左をよく見ると…

現在の天皇の呼び方、2割超が「不敬すぎる表現」していた　宮内庁「そのような表現は無い」

谷原章介、井上純一の酒気帯び事故に注意喚起　飲酒翌日の運転「改めて気をつけないと…」

観光地の自販機が無残にも破壊、「日本はどうなるの」と悲鳴　鎌倉市は「近年の被害なかった」