「ChatGPT」が歯科医師国家試験に挑戦！GPT-3.5とGPT-4でどんな結果の違いがあった？

OpenAIが2023年3月14日（米国時間）に発表した最新AI言語モデル「GPT-4」が、話題をさらっています。この新たなバージョンは、ChatGPTに搭載されており、従来モデルのGPT-3.5と比較して回答の正確性、安全性、入力の自由度が大幅に向上しています。

通院不要の歯科矯正サービスを展開する株式会社Oh my teethは、GPT-4搭載のChatGPTを活用して、歯科医師国家試験の必修問題を解くという取り組みを早速実施。GPT-3.5とGPT-4、それぞれの正答率を検証しました。

はたして、どんな結果となったのでしょうか？株式会社Oh my teethの代表取締役CEOである西野誠氏に検証の内容を詳しく寄稿していただきました。

ChatGPTが日本の歯科医師国家試験に合格できるか検証

今回Oh my teeth社は、2023年3月16日に合格発表のあった「第116回歯科医師国家試験」の必修問題を使って、ChatGPTの実力を試すことにしました。全80問で、合格ラインは正答率80%（67問以上正解）です。

まず、GPT-3.5に試験を受けてもらいました。基本的に問題をそのままコピペし、10問ごとに分割して実施。冒頭に「あなたは、東京医科歯科大学歯学部の首席レベルの優秀な学生です。」と書き、ロール（役割）を明確にしておきました。

すると、このようにGPT-3.5が猛烈スピードで回答してくれました。

回答は集計用のスプレッドシートに転記していきます（頭のよい人に回答済みの問題集を借りて、答えを丸写ししていた高校時代を思い出します…）。

次に、モデルをGPT-4に変更して実施しました。

なお、別冊のレントゲン写真が必要な設問では、質問文の最後に画像URLを貼り付けて対応しました。

実際に画像データを確認しているかはさておき、GPT-4の回答精度はGPT-3.5よりも高い印象でした。

ChatGPTの合格判定は？

GPT-3.5・GPT-4、それぞれの合格判定を発表します。

※回答精度にばらつきがあるため、参考程度にしてください。事実、再度同じプロンプトを送信した際に異なる回答が出力されることがありました。

GPT-3.5：遠く及ばず

従来のChatGPT（GPT-3.5）の正答率は58%でした。合格ラインには届かず不合格ですが、ランダムに回答すると20%程度の正答率になることを考慮すれば、それを大きく上回る性能があると言えます。

| GPT-3.5 |
| — | — |
| 正答数 | 46 |
| 問題数 | 80 |
| 正答率 | 58% |
| 合格基準 | 80% |
| 判定 | 不合格 |

GPT-4：合格ラインを突破

一方、最新モデルのGPT-4を搭載したChatGPTは正答率80%で、合格ラインを突破しました。ただし、受験者の平均正答率は81.4%（麻布デンタルアカデミー「第116回歯科医師国家試験採点サービス」より）なので、特別優秀な成績ではありません。

| GPT-4 |
| — | — |
| 正答数 | 64 |
| 問題数 | 80 |
| 正答率 | 80% |
| 合格基準 | 80% |
| 判定 | 合格 |

過去に模擬試験の仕事に関わった歯科医師に、ChatGPTが誤答した設問リストを見てもらったところ、「簡単な問題を普通に間違えている」との指摘がありました。

英語ではGPT-4が司法試験に上位10％のスコアで合格できると報告されていますが、日本語ではまだ改善の余地があるようです。それでも、GPT-3.5と比べて性能の進化は明確です。

「ChatGPT」が歯科医師国家試験に挑戦！GPT-3.5とGPT-4でどんな結果の違いがあった？

ChatGPTが日本の歯科医師国家試験に合格できるか検証

ChatGPTの合格判定は？

GPT-3.5：遠く及ばず

GPT-4：合格ラインを突破

“アレのやりすぎ”が認知症をグッと進行させる？ 日常に潜むリスクに「心配」「気を付けなきゃ」の声

卵を週2回以上食べると「ある病気」の発症リスクが低下

最強のブタ！？巨体を誇るクマがブタに襲いかかった！！と思ったら、まったく怯まないブタに返り討ちに！

「悠仁さまより愛子さまが天皇にふさわしい」という勘違い

日本ハム・新庄監督、ピッチャー降板後に“とった行動”が話題 「温かいチーム」

小泉進次郎氏が40人以上の支持を集め総裁選出馬へ

薨去された三笠宮妃百合子妃殿下の生涯を振り返る

美智子さま・雅子さまなどの愛用ブランドは？

石破の締め付け、小泉の刺客：決定的な違いとは？

「腕がとれ体が溶ける病気」で数十億のヒトデが死亡。犯人がついに判明

銀行貯金の減り方に「認知症のサイン」が現れると判明！

石破茂氏と高市早苗氏：「裏切り者」の失われた31年

ジャニーズ事務所の屈辱…Love-tune退所→7ORDERとして大活躍の歴史的事件

フランス人が驚いた“日本の便利なキッチングッズ” 「フランスにないなんて信じられない」

毎日の献立から「炭水化物」を抜くと、脳の血流量が増加

ふざけるな石破、ボロが出た小泉進次郎

悠仁親王殿下が成年式に：「皇族としての務めを果たす」決意のお言葉

予約した新幹線、指定席で思わぬ先客に目を疑うも… 「最高すぎる正体」に称賛の声

『あんぱん』“ラスト2分”に絶句… 視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

愛子さまに対し贔屓の引き倒しをする人びと

“アレのやりすぎ”が認知症をグッと進行させる？ 日常に潜むリスクに「心配」「気を付けなきゃ」の声

『あんぱん』“ラスト2分”に絶句… 視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

ふざけるな石破、ボロが出た小泉進次郎

コンセント穴に挿さった謎の物体、恐ろしい正体に目を疑う 「死にかけた」という経験者も…

最強のブタ！？巨体を誇るクマがブタに襲いかかった！！と思ったら、まったく怯まないブタに返り討ちに！

卵を週2回以上食べると「ある病気」の発症リスクが低下

中居正広氏の新たな報道、真実であれば「非常に重い犯罪行為」弁護士が見解 中居氏には“メリット”も

「悠仁さまより愛子さまが天皇にふさわしい」という勘違い

小泉進次郎氏が40人以上の支持を集め総裁選出馬へ

『あんぱん』まさかの“誤読”に視聴者衝撃 「一本取られた」「そこが間違ってたなんて」

石破茂氏と高市早苗氏：「裏切り者」の失われた31年

美智子さま・雅子さまなどの愛用ブランドは？

愛子さまに対し贔屓の引き倒しをする人びと

薨去された三笠宮妃百合子妃殿下の生涯を振り返る

【悲劇】トラの口に靴が入っているのを発見 → 食べかけの動物園来園者の遺体がトラの檻の中で発見される…

80歳・みのもんた、「一時意識不明の重体」報道に心配の声 同様の経験がある人も…

中居正広氏と一緒にいた“人物”が再注目 アルファベット「U」に広がる憶測「別の方向でヤバすぎ…」

岡田克也幹事長夫人の兄・村上誠一郎はトロイの木馬？

『あんぱん』“20秒”だけで涙腺崩壊 流れた次週予告に「泣いたの初めて」「見ただけで…」

石破茂にやめて欲しくない人々

コンビニ駐車場の救急車に張り紙、その内容に目を疑う 「世の中間違ってる」と怒りの声も…

“アレのやりすぎ”が認知症をグッと進行させる？ 日常に潜むリスクに「心配」「気を付けなきゃ」の声

『あんぱん』“ラスト2分”に絶句… 視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

友人から貰った和菓子、パッケージ表記に目を疑う… 衝撃の「6文字」にネット民驚愕

玉木雄一郎 役職停止のご報告

上沼恵美子、レジで店員からされた“ある質問”にイラッ 「気分悪い」「不親切」

水卜麻美アナ、じつは取得していた“資格” 説得力に多くの反響「すごい…」

いとうあさこ、貯金額を聞かれ「返した言葉」に反響 約6割が続かず挫折していた

再び「1世帯10万円」の給付金、対象外の世帯やマイナンバーカードなど注意点も

住民税非課税世帯に3万円給付に現役世代は怒り心頭

ふざけるな石破、ボロが出た小泉進次郎

コンセント穴に挿さった謎の物体、恐ろしい正体に目を疑う 「死にかけた」という経験者も…

最強のブタ！？巨体を誇るクマがブタに襲いかかった！！と思ったら、まったく怯まないブタに返り討ちに！

PAで発見したおにぎり、常識外な金額に目を疑う…「誰が買うんだよ」とネット民驚愕

エアコン使用時、コレだけは絶対したら駄目… 命の危険招く「出しっぱなし」が話題に

卵を週2回以上食べると「ある病気」の発症リスクが低下

エアコンを使うとき4割以上が損してる？ “ある設定”をすると電気代がお得に…

10km/hオーバーまでは捕まらない？なぜ法定速度を超えても捕まらないのか？

「悠仁さまより愛子さまが天皇にふさわしい」という勘違い

偏差値67超え…芦田愛菜が進学「国内最難関」慶應大学法学部の凄さ、懸念材料も

“アレのやりすぎ”が認知症をグッと進行させる？　日常に潜むリスクに「心配」「気を付けなきゃ」の声

日本ハム・新庄監督、ピッチャー降板後に“とった行動”が話題　「温かいチーム」

フランス人が驚いた“日本の便利なキッチングッズ”　「フランスにないなんて信じられない」

予約した新幹線、指定席で思わぬ先客に目を疑うも…　「最高すぎる正体」に称賛の声

『あんぱん』“ラスト2分”に絶句…　視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

“アレのやりすぎ”が認知症をグッと進行させる？　日常に潜むリスクに「心配」「気を付けなきゃ」の声

『あんぱん』“ラスト2分”に絶句…　視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

コンセント穴に挿さった謎の物体、恐ろしい正体に目を疑う　「死にかけた」という経験者も…

中居正広氏の新たな報道、真実であれば「非常に重い犯罪行為」弁護士が見解　中居氏には“メリット”も

『あんぱん』まさかの“誤読”に視聴者衝撃　「一本取られた」「そこが間違ってたなんて」

80歳・みのもんた、「一時意識不明の重体」報道に心配の声　同様の経験がある人も…

中居正広氏と一緒にいた“人物”が再注目　アルファベット「U」に広がる憶測「別の方向でヤバすぎ…」

『あんぱん』“20秒”だけで涙腺崩壊　流れた次週予告に「泣いたの初めて」「見ただけで…」

コンビニ駐車場の救急車に張り紙、その内容に目を疑う　「世の中間違ってる」と怒りの声も…

“アレのやりすぎ”が認知症をグッと進行させる？　日常に潜むリスクに「心配」「気を付けなきゃ」の声

『あんぱん』“ラスト2分”に絶句…　視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

友人から貰った和菓子、パッケージ表記に目を疑う…　衝撃の「6文字」にネット民驚愕

玉木雄一郎　役職停止のご報告

上沼恵美子、レジで店員からされた“ある質問”にイラッ　「気分悪い」「不親切」

水卜麻美アナ、じつは取得していた“資格”　説得力に多くの反響「すごい…」

いとうあさこ、貯金額を聞かれ「返した言葉」に反響　約6割が続かず挫折していた

コンセント穴に挿さった謎の物体、恐ろしい正体に目を疑う　「死にかけた」という経験者も…

エアコン使用時、コレだけは絶対したら駄目…　命の危険招く「出しっぱなし」が話題に

エアコンを使うとき4割以上が損してる？　“ある設定”をすると電気代がお得に…