2025/05/12

AI幻覚は悪化の一途を辿り今後も続く：o3モデルはなぜ間違いが多いのか？

（※またTransluce の第三者評価でも o3 が「行っていないコード実行をでっち上げる」などの幻覚挙動を確認したと報告しています）

要するに、「考えるAI」にするための特殊な訓練プロセスが副作用として幻覚を悪化させているのではないか、という仮説です。

このように幻覚による創作は一見クリエイティブでも、信頼性を損ないかねないため、用途によってはモデルの有用性を大きく下げてしまいます。

先にも触れたように、法律事務所など厳密な正確さが要求される現場で、事実誤認や架空情報を頻繁に混入するAIはとても使えたものではありません。

では解決策はあるのでしょうか？

一つの有望なアプローチは外部の知識源に当たることです。

例えばモデルにウェブ検索をさせて最新の情報や裏付けを取らせれば、幻覚の頻度を下げられる可能性があります。

事実、OpenAIのGPT-4ベースのモデルにウェブ検索機能を組み合わせた実験では、先述の一般課題テストにおいて90%という高精度を記録したとの報告があります。

人間が確認作業をするように、AI自身に裏取りをさせるわけです。

ただしプライバシーやコストの問題もあり、すべてのケースで簡単に導入できる手法ではありません。

また、OpenAIは現在「モデルの幻覚問題に対処すべく継続的に研究開発を行っている」とも述べています。

今後、訓練データやアルゴリズムの改良によって徐々に幻覚を減らしていく努力は続けられるでしょう。

しかし、果たしてそれで十分なのかという声もあります。

言語学者のエミリー・ベンダー氏は、この問題について非常に厳しい見解を示しています。

「これは（基本的に）直せない問題だ」とベンダー氏は言い切ります。

巨大言語モデルは本質的に「言葉の統計的パターン」を生成しているに過ぎず、その技術的枠組みと我々が求める“真実を語るAI”という用途との間には埋め難いミスマッチがある、と彼女は指摘するのです。

AI幻覚は悪化の一途を辿り今後も続く：o3モデルはなぜ間違いが多いのか？

天井に死体が吊るされ、女性を性奴隷化しレイプ部屋送り…「世界最悪の刑務所」の内部を元受刑者が暴露！ 今も行われているイランの人権蹂躙

名医も絶賛、高橋英樹が健康のために食べる“朝メシ” 「80歳で元気な理由がよくわかりました」

“アレのやりすぎ”が認知症をグッと進行させる？ 日常に潜むリスクに「心配」「気を付けなきゃ」の声

テキサス州警察が「UFO映像」を公開！ 住民に注意喚起

宝くじは「万が一当たるとしても」買わない方が良い

あの車に乗るのは運転下手が多い…？板金屋さんに直してきた車聞いたら「ぶつけやすい車・ボディタイプ」の傾向が見えてきた

ADHDの子供は大人になってから「ある物」を頻繁に食べるようになっていた

「運転免許を取らない」若者が急増… 20代が明かした”意外すぎる理由”

元泥棒が明かす狙われる家のポイント 「目からウロコ」の情報続出

恐ろしいほど老ける“意外な朝食”、体にいいと思ってたのに… 皮膚科医の解説に「ほんとに大事」「変えなくては」

広末涼子容疑者の逮捕を受け… 元夫が記者会見で“語った言葉”が話題に 「真実味を帯びてくる…」

青服・白バイクで道路を見守る男性、その正体にゾッとした 「犯罪では？」と怒りの声続出

ギャル曽根の「カニカマの食べ方」が天才すぎた… これは真似したい人多いはず

ゴミ捨て場で発見された「冷凍食品の袋」に違和感… 迷惑すぎる中身に「信じられない」とドン引き

「漸く」の正しい読み方、約6割が勘違いしていると判明 絶対一度は口にしているが…

令和版「女湯に入れる条件」張り紙が話題に 「全国で導入して」「安心できる」と称賛の声

エアコンのフィルター汚れが「身近なもの」でごっそり… 掃除機よりとれて、まさに神ワザ

「予て」って何と読む？ 芸能人の結婚発表にもよく登場するあの言葉…

広末涼子容疑者の逮捕報道で“注目された2文字” 本名も話題に「脳が追いついてない」

やす子、結婚式参列を報告するも… まさかの格好に「その服で出席したの」と驚きの声

天井に死体が吊るされ、女性を性奴隷化しレイプ部屋送り…「世界最悪の刑務所」の内部を元受刑者が暴露！ 今も行われているイランの人権蹂躙

広末涼子容疑者の逮捕を受け… 元夫が記者会見で“語った言葉”が話題に 「真実味を帯びてくる…」

ADHDの子供は大人になってから「ある物」を頻繁に食べるようになっていた

“アレのやりすぎ”が認知症をグッと進行させる？ 日常に潜むリスクに「心配」「気を付けなきゃ」の声

元泥棒が明かす狙われる家のポイント 「目からウロコ」の情報続出

打ち上がったマッコウクジラから7700万円相当の「龍涎香」が見つかる！

年末年始「奇跡の9連休」が物議 「嫌味か？」「うちには関係ない」不満あらわにするユーザー続出

あの車に乗るのは運転下手が多い…？板金屋さんに直してきた車聞いたら「ぶつけやすい車・ボディタイプ」の傾向が見えてきた

恐ろしいほど老ける“意外な朝食”、体にいいと思ってたのに… 皮膚科医の解説に「ほんとに大事」「変えなくては」

テキサス州警察が「UFO映像」を公開！ 住民に注意喚起

大谷翔平選手の本塁打：誤審の可能性を隠す日本のマスコミ

名医も絶賛、高橋英樹が健康のために食べる“朝メシ” 「80歳で元気な理由がよくわかりました」

「運転免許を取らない」若者が急増… 20代が明かした”意外すぎる理由”

3歳の少女が拾った小石が「3800年前のお宝だった」と判明！

エアコンのフィルター汚れが「身近なもの」でごっそり… 掃除機よりとれて、まさに神ワザ

やす子、結婚式参列を報告するも… まさかの格好に「その服で出席したの」と驚きの声

「性暴力」認定の中居正広氏、3ヶ月前の“コメント”が改めて物議 「鳥肌立った」「どんな気分で…」

「漸く」の正しい読み方、約6割が勘違いしていると判明 絶対一度は口にしているが…

青服・白バイクで道路を見守る男性、その正体にゾッとした 「犯罪では？」と怒りの声続出

令和版「女湯に入れる条件」張り紙が話題に 「全国で導入して」「安心できる」と称賛の声

“アレのやりすぎ”が認知症をグッと進行させる？ 日常に潜むリスクに「心配」「気を付けなきゃ」の声

恐ろしいほど老ける“意外な朝食”、体にいいと思ってたのに… 皮膚科医の解説に「ほんとに大事」「変えなくては」

ジェルボール洗剤、消費者庁が警鐘…愛用者急増で事故多発、急性呼吸不全で入院も

あの車に乗るのは運転下手が多い…？板金屋さんに直してきた車聞いたら「ぶつけやすい車・ボディタイプ」の傾向が見えてきた

ファンクラブ閉鎖から36日… 中居正広氏から“突然届いたもの”に「びっくり」「律儀だよね。ほんとに」

「運転免許を取らない」若者が急増… 20代が明かした”意外すぎる理由”

天井に死体が吊るされ、女性を性奴隷化しレイプ部屋送り…「世界最悪の刑務所」の内部を元受刑者が暴露！ 今も行われているイランの人権蹂躙

令和版「女湯に入れる条件」張り紙が話題に 「全国で導入して」「安心できる」と称賛の声

大谷翔平選手の本塁打：誤審の可能性を隠す日本のマスコミ

広末涼子容疑者の逮捕を受け… 元夫が記者会見で“語った言葉”が話題に 「真実味を帯びてくる…」

デヴィ夫人、「あるもの」を失うと人は老ける… すでに約4割の大人が見失っていた

洗顔後の布タオルやめました 辻希美、イモトも愛用するアイテムが「めっちゃいい」

【中る】「なかる」って読んだら恥ずかしい… 簡単な漢字こそ意外と読めない人が多いと判明

ADHDの子供は大人になってから「ある物」を頻繁に食べるようになっていた

ゴミ捨て場で発見された「冷凍食品の袋」に違和感… 迷惑すぎる中身に「信じられない」とドン引き

カズレーザーが驚いた“ダイエット方法”が話題に 「減りすぎて疑うくらい」

日本人の2割超、ローソンの「本名」知らなかった 80年前の呼び名に思わず驚き…

ギャル曽根の「カニカマの食べ方」が天才すぎた… これは真似したい人多いはず

年末年始「奇跡の9連休」が物議 「嫌味か？」「うちには関係ない」不満あらわにするユーザー続出

「漸く」の正しい読み方、約6割が勘違いしていると判明 絶対一度は口にしているが…

天井に死体が吊るされ、女性を性奴隷化しレイプ部屋送り…「世界最悪の刑務所」の内部を元受刑者が暴露！今も行われているイランの人権蹂躙

名医も絶賛、高橋英樹が健康のために食べる“朝メシ”　「80歳で元気な理由がよくわかりました」

“アレのやりすぎ”が認知症をグッと進行させる？　日常に潜むリスクに「心配」「気を付けなきゃ」の声

テキサス州警察が「UFO映像」を公開！住民に注意喚起

「運転免許を取らない」若者が急増…　20代が明かした”意外すぎる理由”

元泥棒が明かす狙われる家のポイント「目からウロコ」の情報続出

恐ろしいほど老ける“意外な朝食”、体にいいと思ってたのに…　皮膚科医の解説に「ほんとに大事」「変えなくては」

広末涼子容疑者の逮捕を受け…　元夫が記者会見で“語った言葉”が話題に　「真実味を帯びてくる…」

青服・白バイクで道路を見守る男性、その正体にゾッとした　「犯罪では？」と怒りの声続出

ギャル曽根の「カニカマの食べ方」が天才すぎた…　これは真似したい人多いはず

ゴミ捨て場で発見された「冷凍食品の袋」に違和感…　迷惑すぎる中身に「信じられない」とドン引き

「漸く」の正しい読み方、約6割が勘違いしていると判明　絶対一度は口にしているが…

令和版「女湯に入れる条件」張り紙が話題に　「全国で導入して」「安心できる」と称賛の声

エアコンのフィルター汚れが「身近なもの」でごっそり…　掃除機よりとれて、まさに神ワザ

「予て」って何と読む？　芸能人の結婚発表にもよく登場するあの言葉…

広末涼子容疑者の逮捕報道で“注目された2文字”　本名も話題に「脳が追いついてない」

やす子、結婚式参列を報告するも…　まさかの格好に「その服で出席したの」と驚きの声

天井に死体が吊るされ、女性を性奴隷化しレイプ部屋送り…「世界最悪の刑務所」の内部を元受刑者が暴露！今も行われているイランの人権蹂躙

広末涼子容疑者の逮捕を受け…　元夫が記者会見で“語った言葉”が話題に　「真実味を帯びてくる…」

“アレのやりすぎ”が認知症をグッと進行させる？　日常に潜むリスクに「心配」「気を付けなきゃ」の声

元泥棒が明かす狙われる家のポイント「目からウロコ」の情報続出

年末年始「奇跡の9連休」が物議　「嫌味か？」「うちには関係ない」不満あらわにするユーザー続出

恐ろしいほど老ける“意外な朝食”、体にいいと思ってたのに…　皮膚科医の解説に「ほんとに大事」「変えなくては」

テキサス州警察が「UFO映像」を公開！住民に注意喚起

名医も絶賛、高橋英樹が健康のために食べる“朝メシ”　「80歳で元気な理由がよくわかりました」

「運転免許を取らない」若者が急増…　20代が明かした”意外すぎる理由”

エアコンのフィルター汚れが「身近なもの」でごっそり…　掃除機よりとれて、まさに神ワザ

やす子、結婚式参列を報告するも…　まさかの格好に「その服で出席したの」と驚きの声

「性暴力」認定の中居正広氏、3ヶ月前の“コメント”が改めて物議　「鳥肌立った」「どんな気分で…」

「漸く」の正しい読み方、約6割が勘違いしていると判明　絶対一度は口にしているが…

青服・白バイクで道路を見守る男性、その正体にゾッとした　「犯罪では？」と怒りの声続出

令和版「女湯に入れる条件」張り紙が話題に　「全国で導入して」「安心できる」と称賛の声

“アレのやりすぎ”が認知症をグッと進行させる？　日常に潜むリスクに「心配」「気を付けなきゃ」の声

恐ろしいほど老ける“意外な朝食”、体にいいと思ってたのに…　皮膚科医の解説に「ほんとに大事」「変えなくては」

ファンクラブ閉鎖から36日…　中居正広氏から“突然届いたもの”に「びっくり」「律儀だよね。ほんとに」

「運転免許を取らない」若者が急増…　20代が明かした”意外すぎる理由”

天井に死体が吊るされ、女性を性奴隷化しレイプ部屋送り…「世界最悪の刑務所」の内部を元受刑者が暴露！今も行われているイランの人権蹂躙

令和版「女湯に入れる条件」張り紙が話題に　「全国で導入して」「安心できる」と称賛の声

広末涼子容疑者の逮捕を受け…　元夫が記者会見で“語った言葉”が話題に　「真実味を帯びてくる…」

デヴィ夫人、「あるもの」を失うと人は老ける…　すでに約4割の大人が見失っていた

洗顔後の布タオルやめました　辻希美、イモトも愛用するアイテムが「めっちゃいい」

【中る】「なかる」って読んだら恥ずかしい…　簡単な漢字こそ意外と読めない人が多いと判明

ゴミ捨て場で発見された「冷凍食品の袋」に違和感…　迷惑すぎる中身に「信じられない」とドン引き

カズレーザーが驚いた“ダイエット方法”が話題に　「減りすぎて疑うくらい」

日本人の2割超、ローソンの「本名」知らなかった　80年前の呼び名に思わず驚き…

ギャル曽根の「カニカマの食べ方」が天才すぎた…　これは真似したい人多いはず

年末年始「奇跡の9連休」が物議　「嫌味か？」「うちには関係ない」不満あらわにするユーザー続出

「漸く」の正しい読み方、約6割が勘違いしていると判明　絶対一度は口にしているが…