2025/05/12

AI幻覚は悪化の一途を辿り今後も続く：o3モデルはなぜ間違いが多いのか？

「新しいモデルほど幻覚は減る」というこれまでの漸進的改善の流れが、ここにきて崩れてしまったように見えるからです。

この異例の結果に対し、OpenAIは「なぜこのようなことが起きているのか現時点では分かっていない」と述べています。

社内レポートでも「さらなる研究が必要」と認めており、今後原因の解明に取り組む姿勢が示されています。

この社内テスト結果は業界に衝撃を与え、外部の第三者機関も独自検証を行いました。

非営利AI研究機関のTransluceによるテストでも、o3の幻覚傾向が確認されています。

例えば、質問に答える過程で「ChatGPTの外部で2021年製のMacBook Pro上でコードを実行し、その結果をコピーした」とAIが語ったケースが報告されました。

もちろん現実には、ChatGPTの範囲外で勝手にコードを動かすことなどできません。

これはモデルがあたかも自分でプログラムを走らせ検証したかのように架空のプロセスをでっち上げた例です。

また他のテスト利用者からは、回答中に提示されたウェブリンクをクリックすると存在しないURLであることが頻繁にあったとの指摘もありました。

著者の個人的な印象でも、o3モデルにおいて明白な幻覚がみられました。

資料作成や論文作成のときに関連研究の論文名とそのリンクや掲載された科学雑誌を生成させると、o3はもっともらしいURLや雑誌名を提示するものの、実際にクリックすると存在しないページだったり全く違う雑誌名であったという例が頻繁にみられました。裏付けとなる出典リンクが示されると安心しがちですが、それがデタラメな捏造リンクや間違った科学雑誌では信用性はゼロです。

要するに、新モデルはさも本当らしい詳細を饒舌に語るものの、その一部は現実には裏付けのない作り話だったというわけです。

興味深いことに、こうした欠点と裏表の関係にあるように、新モデルはタスク遂行能力自体は飛躍的に向上しています。

AI幻覚は悪化の一途を辿り今後も続く：o3モデルはなぜ間違いが多いのか？

天井に死体が吊るされ、女性を性奴隷化しレイプ部屋送り…「世界最悪の刑務所」の内部を元受刑者が暴露！ 今も行われているイランの人権蹂躙

名医も絶賛、高橋英樹が健康のために食べる“朝メシ” 「80歳で元気な理由がよくわかりました」

“アレのやりすぎ”が認知症をグッと進行させる？ 日常に潜むリスクに「心配」「気を付けなきゃ」の声

テキサス州警察が「UFO映像」を公開！ 住民に注意喚起

宝くじは「万が一当たるとしても」買わない方が良い

あの車に乗るのは運転下手が多い…？板金屋さんに直してきた車聞いたら「ぶつけやすい車・ボディタイプ」の傾向が見えてきた

ADHDの子供は大人になってから「ある物」を頻繁に食べるようになっていた

「運転免許を取らない」若者が急増… 20代が明かした”意外すぎる理由”

元泥棒が明かす狙われる家のポイント 「目からウロコ」の情報続出

恐ろしいほど老ける“意外な朝食”、体にいいと思ってたのに… 皮膚科医の解説に「ほんとに大事」「変えなくては」

広末涼子容疑者の逮捕を受け… 元夫が記者会見で“語った言葉”が話題に 「真実味を帯びてくる…」

青服・白バイクで道路を見守る男性、その正体にゾッとした 「犯罪では？」と怒りの声続出

ギャル曽根の「カニカマの食べ方」が天才すぎた… これは真似したい人多いはず

ゴミ捨て場で発見された「冷凍食品の袋」に違和感… 迷惑すぎる中身に「信じられない」とドン引き

「漸く」の正しい読み方、約6割が勘違いしていると判明 絶対一度は口にしているが…

令和版「女湯に入れる条件」張り紙が話題に 「全国で導入して」「安心できる」と称賛の声

エアコンのフィルター汚れが「身近なもの」でごっそり… 掃除機よりとれて、まさに神ワザ

「予て」って何と読む？ 芸能人の結婚発表にもよく登場するあの言葉…

広末涼子容疑者の逮捕報道で“注目された2文字” 本名も話題に「脳が追いついてない」

やす子、結婚式参列を報告するも… まさかの格好に「その服で出席したの」と驚きの声

天井に死体が吊るされ、女性を性奴隷化しレイプ部屋送り…「世界最悪の刑務所」の内部を元受刑者が暴露！ 今も行われているイランの人権蹂躙

広末涼子容疑者の逮捕を受け… 元夫が記者会見で“語った言葉”が話題に 「真実味を帯びてくる…」

ADHDの子供は大人になってから「ある物」を頻繁に食べるようになっていた

“アレのやりすぎ”が認知症をグッと進行させる？ 日常に潜むリスクに「心配」「気を付けなきゃ」の声

元泥棒が明かす狙われる家のポイント 「目からウロコ」の情報続出

打ち上がったマッコウクジラから7700万円相当の「龍涎香」が見つかる！

年末年始「奇跡の9連休」が物議 「嫌味か？」「うちには関係ない」不満あらわにするユーザー続出

あの車に乗るのは運転下手が多い…？板金屋さんに直してきた車聞いたら「ぶつけやすい車・ボディタイプ」の傾向が見えてきた

恐ろしいほど老ける“意外な朝食”、体にいいと思ってたのに… 皮膚科医の解説に「ほんとに大事」「変えなくては」

テキサス州警察が「UFO映像」を公開！ 住民に注意喚起

大谷翔平選手の本塁打：誤審の可能性を隠す日本のマスコミ

名医も絶賛、高橋英樹が健康のために食べる“朝メシ” 「80歳で元気な理由がよくわかりました」

「運転免許を取らない」若者が急増… 20代が明かした”意外すぎる理由”

3歳の少女が拾った小石が「3800年前のお宝だった」と判明！

エアコンのフィルター汚れが「身近なもの」でごっそり… 掃除機よりとれて、まさに神ワザ

やす子、結婚式参列を報告するも… まさかの格好に「その服で出席したの」と驚きの声

「性暴力」認定の中居正広氏、3ヶ月前の“コメント”が改めて物議 「鳥肌立った」「どんな気分で…」

「漸く」の正しい読み方、約6割が勘違いしていると判明 絶対一度は口にしているが…

青服・白バイクで道路を見守る男性、その正体にゾッとした 「犯罪では？」と怒りの声続出

令和版「女湯に入れる条件」張り紙が話題に 「全国で導入して」「安心できる」と称賛の声

“アレのやりすぎ”が認知症をグッと進行させる？ 日常に潜むリスクに「心配」「気を付けなきゃ」の声

恐ろしいほど老ける“意外な朝食”、体にいいと思ってたのに… 皮膚科医の解説に「ほんとに大事」「変えなくては」

ジェルボール洗剤、消費者庁が警鐘…愛用者急増で事故多発、急性呼吸不全で入院も

あの車に乗るのは運転下手が多い…？板金屋さんに直してきた車聞いたら「ぶつけやすい車・ボディタイプ」の傾向が見えてきた

ファンクラブ閉鎖から36日… 中居正広氏から“突然届いたもの”に「びっくり」「律儀だよね。ほんとに」

「運転免許を取らない」若者が急増… 20代が明かした”意外すぎる理由”

天井に死体が吊るされ、女性を性奴隷化しレイプ部屋送り…「世界最悪の刑務所」の内部を元受刑者が暴露！ 今も行われているイランの人権蹂躙

令和版「女湯に入れる条件」張り紙が話題に 「全国で導入して」「安心できる」と称賛の声

大谷翔平選手の本塁打：誤審の可能性を隠す日本のマスコミ

広末涼子容疑者の逮捕を受け… 元夫が記者会見で“語った言葉”が話題に 「真実味を帯びてくる…」

デヴィ夫人、「あるもの」を失うと人は老ける… すでに約4割の大人が見失っていた

洗顔後の布タオルやめました 辻希美、イモトも愛用するアイテムが「めっちゃいい」

【中る】「なかる」って読んだら恥ずかしい… 簡単な漢字こそ意外と読めない人が多いと判明

ADHDの子供は大人になってから「ある物」を頻繁に食べるようになっていた

ゴミ捨て場で発見された「冷凍食品の袋」に違和感… 迷惑すぎる中身に「信じられない」とドン引き

カズレーザーが驚いた“ダイエット方法”が話題に 「減りすぎて疑うくらい」

日本人の2割超、ローソンの「本名」知らなかった 80年前の呼び名に思わず驚き…

ギャル曽根の「カニカマの食べ方」が天才すぎた… これは真似したい人多いはず

年末年始「奇跡の9連休」が物議 「嫌味か？」「うちには関係ない」不満あらわにするユーザー続出

「漸く」の正しい読み方、約6割が勘違いしていると判明 絶対一度は口にしているが…

天井に死体が吊るされ、女性を性奴隷化しレイプ部屋送り…「世界最悪の刑務所」の内部を元受刑者が暴露！今も行われているイランの人権蹂躙

名医も絶賛、高橋英樹が健康のために食べる“朝メシ”　「80歳で元気な理由がよくわかりました」

“アレのやりすぎ”が認知症をグッと進行させる？　日常に潜むリスクに「心配」「気を付けなきゃ」の声

テキサス州警察が「UFO映像」を公開！住民に注意喚起

「運転免許を取らない」若者が急増…　20代が明かした”意外すぎる理由”

元泥棒が明かす狙われる家のポイント「目からウロコ」の情報続出

恐ろしいほど老ける“意外な朝食”、体にいいと思ってたのに…　皮膚科医の解説に「ほんとに大事」「変えなくては」

広末涼子容疑者の逮捕を受け…　元夫が記者会見で“語った言葉”が話題に　「真実味を帯びてくる…」

青服・白バイクで道路を見守る男性、その正体にゾッとした　「犯罪では？」と怒りの声続出

ギャル曽根の「カニカマの食べ方」が天才すぎた…　これは真似したい人多いはず

ゴミ捨て場で発見された「冷凍食品の袋」に違和感…　迷惑すぎる中身に「信じられない」とドン引き

「漸く」の正しい読み方、約6割が勘違いしていると判明　絶対一度は口にしているが…

令和版「女湯に入れる条件」張り紙が話題に　「全国で導入して」「安心できる」と称賛の声

エアコンのフィルター汚れが「身近なもの」でごっそり…　掃除機よりとれて、まさに神ワザ

「予て」って何と読む？　芸能人の結婚発表にもよく登場するあの言葉…

広末涼子容疑者の逮捕報道で“注目された2文字”　本名も話題に「脳が追いついてない」

やす子、結婚式参列を報告するも…　まさかの格好に「その服で出席したの」と驚きの声

天井に死体が吊るされ、女性を性奴隷化しレイプ部屋送り…「世界最悪の刑務所」の内部を元受刑者が暴露！今も行われているイランの人権蹂躙

広末涼子容疑者の逮捕を受け…　元夫が記者会見で“語った言葉”が話題に　「真実味を帯びてくる…」

“アレのやりすぎ”が認知症をグッと進行させる？　日常に潜むリスクに「心配」「気を付けなきゃ」の声

元泥棒が明かす狙われる家のポイント「目からウロコ」の情報続出

年末年始「奇跡の9連休」が物議　「嫌味か？」「うちには関係ない」不満あらわにするユーザー続出

恐ろしいほど老ける“意外な朝食”、体にいいと思ってたのに…　皮膚科医の解説に「ほんとに大事」「変えなくては」

テキサス州警察が「UFO映像」を公開！住民に注意喚起

名医も絶賛、高橋英樹が健康のために食べる“朝メシ”　「80歳で元気な理由がよくわかりました」

「運転免許を取らない」若者が急増…　20代が明かした”意外すぎる理由”

エアコンのフィルター汚れが「身近なもの」でごっそり…　掃除機よりとれて、まさに神ワザ

やす子、結婚式参列を報告するも…　まさかの格好に「その服で出席したの」と驚きの声

「性暴力」認定の中居正広氏、3ヶ月前の“コメント”が改めて物議　「鳥肌立った」「どんな気分で…」

「漸く」の正しい読み方、約6割が勘違いしていると判明　絶対一度は口にしているが…

青服・白バイクで道路を見守る男性、その正体にゾッとした　「犯罪では？」と怒りの声続出

令和版「女湯に入れる条件」張り紙が話題に　「全国で導入して」「安心できる」と称賛の声

“アレのやりすぎ”が認知症をグッと進行させる？　日常に潜むリスクに「心配」「気を付けなきゃ」の声

恐ろしいほど老ける“意外な朝食”、体にいいと思ってたのに…　皮膚科医の解説に「ほんとに大事」「変えなくては」

ファンクラブ閉鎖から36日…　中居正広氏から“突然届いたもの”に「びっくり」「律儀だよね。ほんとに」

「運転免許を取らない」若者が急増…　20代が明かした”意外すぎる理由”

天井に死体が吊るされ、女性を性奴隷化しレイプ部屋送り…「世界最悪の刑務所」の内部を元受刑者が暴露！今も行われているイランの人権蹂躙

令和版「女湯に入れる条件」張り紙が話題に　「全国で導入して」「安心できる」と称賛の声

広末涼子容疑者の逮捕を受け…　元夫が記者会見で“語った言葉”が話題に　「真実味を帯びてくる…」

デヴィ夫人、「あるもの」を失うと人は老ける…　すでに約4割の大人が見失っていた

洗顔後の布タオルやめました　辻希美、イモトも愛用するアイテムが「めっちゃいい」

【中る】「なかる」って読んだら恥ずかしい…　簡単な漢字こそ意外と読めない人が多いと判明

ゴミ捨て場で発見された「冷凍食品の袋」に違和感…　迷惑すぎる中身に「信じられない」とドン引き

カズレーザーが驚いた“ダイエット方法”が話題に　「減りすぎて疑うくらい」

日本人の2割超、ローソンの「本名」知らなかった　80年前の呼び名に思わず驚き…

ギャル曽根の「カニカマの食べ方」が天才すぎた…　これは真似したい人多いはず

年末年始「奇跡の9連休」が物議　「嫌味か？」「うちには関係ない」不満あらわにするユーザー続出

「漸く」の正しい読み方、約6割が勘違いしていると判明　絶対一度は口にしているが…