2025/05/12

AI幻覚は悪化の一途を辿り今後も続く：o3モデルはなぜ間違いが多いのか？

o3やo4-miniでは回答を出す前に内部で長い「思考の連鎖 (Chain of Thought)」を巡らせ、あたかも人間が頭の中で段取りを踏むように結論を導き出します。

例えば数学の難問やプログラミングのデバッグといった多面的な分析が必要な課題でも、小さなステップに分解して推論するため、より正確な解答を出せるよう設計されています。

また、この新モデルはあらゆるツールを自律的に活用できる点も画期的です。

インターネットでの情報検索、Pythonスクリプトによるデータ解析、画像生成や画像認識といったツールを、必要に応じて自ら判断して使いこなすことで、複雑なタスクをエンドツーエンドで実行できるのです。

視覚情報についても、単に画像を説明するに留まらず「画像と一緒に考える」ことが可能になりました。

例えばホワイトボードに書かれた数式の写真を与えれば、画像を回転・拡大しながら内容を読み取って推論を進めるといった、人間さながらの問題解決も実現しています。

こうした推論力の強化により、最新モデルはさまざまなベンチマークで従来を上回る成績を収めています。

o3はプログラミング競技やビジネス分析などの難問で従来モデル（o1）より重大な誤りが減少し、特にプログラミングやコンサルティング、創造的発想の分野で「分析が緻密で新しい仮説を批判的に評価できる」と高く評価されました。

小型モデルのo4-miniも非常に効率が良く、o1よりプログラミングや数学のベンチマークで高い正解率を示しています。

このように、OpenAIが目指したのは人間のように道具を使いながら深く考え、難問に取り組めるAIです。

その目的は、高度化するユーザーのニーズに応え、より信頼でき有用なAIアシスタントを実現することにありました。

o3モデルは「賢く」でも「間違いが多く」進化した

AI幻覚は悪化の一途を辿り今後も続く：o3モデルはなぜ間違いが多いのか？

o3モデルは「賢く」でも「間違いが多く」進化した

天井に死体が吊るされ、女性を性奴隷化しレイプ部屋送り…「世界最悪の刑務所」の内部を元受刑者が暴露！ 今も行われているイランの人権蹂躙

名医も絶賛、高橋英樹が健康のために食べる“朝メシ” 「80歳で元気な理由がよくわかりました」

“アレのやりすぎ”が認知症をグッと進行させる？ 日常に潜むリスクに「心配」「気を付けなきゃ」の声

テキサス州警察が「UFO映像」を公開！ 住民に注意喚起

宝くじは「万が一当たるとしても」買わない方が良い

あの車に乗るのは運転下手が多い…？板金屋さんに直してきた車聞いたら「ぶつけやすい車・ボディタイプ」の傾向が見えてきた

ADHDの子供は大人になってから「ある物」を頻繁に食べるようになっていた

「運転免許を取らない」若者が急増… 20代が明かした”意外すぎる理由”

元泥棒が明かす狙われる家のポイント 「目からウロコ」の情報続出

恐ろしいほど老ける“意外な朝食”、体にいいと思ってたのに… 皮膚科医の解説に「ほんとに大事」「変えなくては」

広末涼子容疑者の逮捕を受け… 元夫が記者会見で“語った言葉”が話題に 「真実味を帯びてくる…」

青服・白バイクで道路を見守る男性、その正体にゾッとした 「犯罪では？」と怒りの声続出

ギャル曽根の「カニカマの食べ方」が天才すぎた… これは真似したい人多いはず

ゴミ捨て場で発見された「冷凍食品の袋」に違和感… 迷惑すぎる中身に「信じられない」とドン引き

「漸く」の正しい読み方、約6割が勘違いしていると判明 絶対一度は口にしているが…

令和版「女湯に入れる条件」張り紙が話題に 「全国で導入して」「安心できる」と称賛の声

エアコンのフィルター汚れが「身近なもの」でごっそり… 掃除機よりとれて、まさに神ワザ

「予て」って何と読む？ 芸能人の結婚発表にもよく登場するあの言葉…

広末涼子容疑者の逮捕報道で“注目された2文字” 本名も話題に「脳が追いついてない」

やす子、結婚式参列を報告するも… まさかの格好に「その服で出席したの」と驚きの声

天井に死体が吊るされ、女性を性奴隷化しレイプ部屋送り…「世界最悪の刑務所」の内部を元受刑者が暴露！ 今も行われているイランの人権蹂躙

広末涼子容疑者の逮捕を受け… 元夫が記者会見で“語った言葉”が話題に 「真実味を帯びてくる…」

ADHDの子供は大人になってから「ある物」を頻繁に食べるようになっていた

“アレのやりすぎ”が認知症をグッと進行させる？ 日常に潜むリスクに「心配」「気を付けなきゃ」の声

元泥棒が明かす狙われる家のポイント 「目からウロコ」の情報続出

打ち上がったマッコウクジラから7700万円相当の「龍涎香」が見つかる！

年末年始「奇跡の9連休」が物議 「嫌味か？」「うちには関係ない」不満あらわにするユーザー続出

あの車に乗るのは運転下手が多い…？板金屋さんに直してきた車聞いたら「ぶつけやすい車・ボディタイプ」の傾向が見えてきた

恐ろしいほど老ける“意外な朝食”、体にいいと思ってたのに… 皮膚科医の解説に「ほんとに大事」「変えなくては」

テキサス州警察が「UFO映像」を公開！ 住民に注意喚起

大谷翔平選手の本塁打：誤審の可能性を隠す日本のマスコミ

名医も絶賛、高橋英樹が健康のために食べる“朝メシ” 「80歳で元気な理由がよくわかりました」

「運転免許を取らない」若者が急増… 20代が明かした”意外すぎる理由”

3歳の少女が拾った小石が「3800年前のお宝だった」と判明！

エアコンのフィルター汚れが「身近なもの」でごっそり… 掃除機よりとれて、まさに神ワザ

やす子、結婚式参列を報告するも… まさかの格好に「その服で出席したの」と驚きの声

「性暴力」認定の中居正広氏、3ヶ月前の“コメント”が改めて物議 「鳥肌立った」「どんな気分で…」

「漸く」の正しい読み方、約6割が勘違いしていると判明 絶対一度は口にしているが…

青服・白バイクで道路を見守る男性、その正体にゾッとした 「犯罪では？」と怒りの声続出

令和版「女湯に入れる条件」張り紙が話題に 「全国で導入して」「安心できる」と称賛の声

“アレのやりすぎ”が認知症をグッと進行させる？ 日常に潜むリスクに「心配」「気を付けなきゃ」の声

恐ろしいほど老ける“意外な朝食”、体にいいと思ってたのに… 皮膚科医の解説に「ほんとに大事」「変えなくては」

ジェルボール洗剤、消費者庁が警鐘…愛用者急増で事故多発、急性呼吸不全で入院も

あの車に乗るのは運転下手が多い…？板金屋さんに直してきた車聞いたら「ぶつけやすい車・ボディタイプ」の傾向が見えてきた

ファンクラブ閉鎖から36日… 中居正広氏から“突然届いたもの”に「びっくり」「律儀だよね。ほんとに」

「運転免許を取らない」若者が急増… 20代が明かした”意外すぎる理由”

天井に死体が吊るされ、女性を性奴隷化しレイプ部屋送り…「世界最悪の刑務所」の内部を元受刑者が暴露！ 今も行われているイランの人権蹂躙

令和版「女湯に入れる条件」張り紙が話題に 「全国で導入して」「安心できる」と称賛の声

大谷翔平選手の本塁打：誤審の可能性を隠す日本のマスコミ

広末涼子容疑者の逮捕を受け… 元夫が記者会見で“語った言葉”が話題に 「真実味を帯びてくる…」

デヴィ夫人、「あるもの」を失うと人は老ける… すでに約4割の大人が見失っていた

洗顔後の布タオルやめました 辻希美、イモトも愛用するアイテムが「めっちゃいい」

【中る】「なかる」って読んだら恥ずかしい… 簡単な漢字こそ意外と読めない人が多いと判明

ADHDの子供は大人になってから「ある物」を頻繁に食べるようになっていた

ゴミ捨て場で発見された「冷凍食品の袋」に違和感… 迷惑すぎる中身に「信じられない」とドン引き

カズレーザーが驚いた“ダイエット方法”が話題に 「減りすぎて疑うくらい」

日本人の2割超、ローソンの「本名」知らなかった 80年前の呼び名に思わず驚き…

ギャル曽根の「カニカマの食べ方」が天才すぎた… これは真似したい人多いはず

年末年始「奇跡の9連休」が物議 「嫌味か？」「うちには関係ない」不満あらわにするユーザー続出

「漸く」の正しい読み方、約6割が勘違いしていると判明 絶対一度は口にしているが…

天井に死体が吊るされ、女性を性奴隷化しレイプ部屋送り…「世界最悪の刑務所」の内部を元受刑者が暴露！今も行われているイランの人権蹂躙

名医も絶賛、高橋英樹が健康のために食べる“朝メシ”　「80歳で元気な理由がよくわかりました」

“アレのやりすぎ”が認知症をグッと進行させる？　日常に潜むリスクに「心配」「気を付けなきゃ」の声

テキサス州警察が「UFO映像」を公開！住民に注意喚起

「運転免許を取らない」若者が急増…　20代が明かした”意外すぎる理由”

元泥棒が明かす狙われる家のポイント「目からウロコ」の情報続出

恐ろしいほど老ける“意外な朝食”、体にいいと思ってたのに…　皮膚科医の解説に「ほんとに大事」「変えなくては」

広末涼子容疑者の逮捕を受け…　元夫が記者会見で“語った言葉”が話題に　「真実味を帯びてくる…」

青服・白バイクで道路を見守る男性、その正体にゾッとした　「犯罪では？」と怒りの声続出

ギャル曽根の「カニカマの食べ方」が天才すぎた…　これは真似したい人多いはず

ゴミ捨て場で発見された「冷凍食品の袋」に違和感…　迷惑すぎる中身に「信じられない」とドン引き

「漸く」の正しい読み方、約6割が勘違いしていると判明　絶対一度は口にしているが…

令和版「女湯に入れる条件」張り紙が話題に　「全国で導入して」「安心できる」と称賛の声

エアコンのフィルター汚れが「身近なもの」でごっそり…　掃除機よりとれて、まさに神ワザ

「予て」って何と読む？　芸能人の結婚発表にもよく登場するあの言葉…

広末涼子容疑者の逮捕報道で“注目された2文字”　本名も話題に「脳が追いついてない」

やす子、結婚式参列を報告するも…　まさかの格好に「その服で出席したの」と驚きの声

天井に死体が吊るされ、女性を性奴隷化しレイプ部屋送り…「世界最悪の刑務所」の内部を元受刑者が暴露！今も行われているイランの人権蹂躙

広末涼子容疑者の逮捕を受け…　元夫が記者会見で“語った言葉”が話題に　「真実味を帯びてくる…」

“アレのやりすぎ”が認知症をグッと進行させる？　日常に潜むリスクに「心配」「気を付けなきゃ」の声

元泥棒が明かす狙われる家のポイント「目からウロコ」の情報続出

年末年始「奇跡の9連休」が物議　「嫌味か？」「うちには関係ない」不満あらわにするユーザー続出

恐ろしいほど老ける“意外な朝食”、体にいいと思ってたのに…　皮膚科医の解説に「ほんとに大事」「変えなくては」

テキサス州警察が「UFO映像」を公開！住民に注意喚起

名医も絶賛、高橋英樹が健康のために食べる“朝メシ”　「80歳で元気な理由がよくわかりました」

「運転免許を取らない」若者が急増…　20代が明かした”意外すぎる理由”

エアコンのフィルター汚れが「身近なもの」でごっそり…　掃除機よりとれて、まさに神ワザ

やす子、結婚式参列を報告するも…　まさかの格好に「その服で出席したの」と驚きの声

「性暴力」認定の中居正広氏、3ヶ月前の“コメント”が改めて物議　「鳥肌立った」「どんな気分で…」

「漸く」の正しい読み方、約6割が勘違いしていると判明　絶対一度は口にしているが…

青服・白バイクで道路を見守る男性、その正体にゾッとした　「犯罪では？」と怒りの声続出

令和版「女湯に入れる条件」張り紙が話題に　「全国で導入して」「安心できる」と称賛の声

“アレのやりすぎ”が認知症をグッと進行させる？　日常に潜むリスクに「心配」「気を付けなきゃ」の声

恐ろしいほど老ける“意外な朝食”、体にいいと思ってたのに…　皮膚科医の解説に「ほんとに大事」「変えなくては」

ファンクラブ閉鎖から36日…　中居正広氏から“突然届いたもの”に「びっくり」「律儀だよね。ほんとに」

「運転免許を取らない」若者が急増…　20代が明かした”意外すぎる理由”

天井に死体が吊るされ、女性を性奴隷化しレイプ部屋送り…「世界最悪の刑務所」の内部を元受刑者が暴露！今も行われているイランの人権蹂躙

令和版「女湯に入れる条件」張り紙が話題に　「全国で導入して」「安心できる」と称賛の声

広末涼子容疑者の逮捕を受け…　元夫が記者会見で“語った言葉”が話題に　「真実味を帯びてくる…」

デヴィ夫人、「あるもの」を失うと人は老ける…　すでに約4割の大人が見失っていた

洗顔後の布タオルやめました　辻希美、イモトも愛用するアイテムが「めっちゃいい」

【中る】「なかる」って読んだら恥ずかしい…　簡単な漢字こそ意外と読めない人が多いと判明

ゴミ捨て場で発見された「冷凍食品の袋」に違和感…　迷惑すぎる中身に「信じられない」とドン引き

カズレーザーが驚いた“ダイエット方法”が話題に　「減りすぎて疑うくらい」

日本人の2割超、ローソンの「本名」知らなかった　80年前の呼び名に思わず驚き…

ギャル曽根の「カニカマの食べ方」が天才すぎた…　これは真似したい人多いはず

年末年始「奇跡の9連休」が物議　「嫌味か？」「うちには関係ない」不満あらわにするユーザー続出

「漸く」の正しい読み方、約6割が勘違いしていると判明　絶対一度は口にしているが…