ChatGPTとは人工知能が人間の投げかけに対し、自然な回答や文章を生成するサービスです。しかし、結局ChatGPTはなにができるのか、きちんと把握できていない方も少なくないのではないでしょうか。

この記事ではChatGPTの特徴やできること、アカウント作成手順、質問の仕方などを詳しく解説します。

ChatGPTとは?

ChatGPTって結局何?できることやアカウント作成手順、質問の仕方を解説
(画像=ChatGPTは人間の投げかけに対し、ChatGPTがそれに応じた返答や文章、表やコードなどを生成してくれるAIです。無料版と有料版があり、2023年5月現在、有料版は月20ドルで最新モデルであるGPT-4が利用可能。GPT-4は日本の医師国家試験の合格ラインを超えたとして話題になりました,『オトナライフ』より 引用)

大規模言語モデル(LLM)を用いた生成AI

ChatGPTを技術面から簡潔にまとめると「対話特化型の汎用性が高い大規模言語モデル(LLM)」です。大規模言語モデル(LLM)と従来の自然言語処理の違いは、以下の画像の通り。なお大規模言語モデル(LLM)の例として、GPT-3を従来の自然言語処理と比較しています。

ChatGPTって結局何?できることやアカウント作成手順、質問の仕方を解説
(画像=たとえば「私は猫が好きだ」を英訳する場合、従来の自然言語処理ではテキストデータを事前学習したうえで、翻訳に特化したタスクを与える「ファインチューニング」が必要でした。しかしGPT-3に代表されるChatGPTの技術では、事前学習したテキストデータを与えるとファインチューニングの工程を飛ばして「”私が猫が好きだ”という文章を英訳してください」というプロンプトに対し、確率的に返答として続きそうなテキストを出力することが可能になりました。ChatGPTが翻訳にも要約にも、Excelの関数制作にも汎用的に使える最大の要因はこの「確率的に続きそうなテキストの出力」にあるのです,『オトナライフ』より 引用)

ChatGPTで使われている技術

ChatGPTで使われている技術には様々なものがありますが、とくにブレークスルーとなったのは「GPT-3」。この技術をベースに、OpenAIが「InstructGPT」の研究も強力に推し進めたことで、ChatGPTの高品質な受け答えが実現されています。

GPT-3

GPT-3は2020年に発表された自然言語技術処理モデルの1つ。ちなみに、その1つ前のバージョンである「【リンク:公式URL】GPT-2【/リンク:公式URL】 」は2019年にオープンソースで配布されています。

GPT-3の最大の特徴は、先にも述べた通り「確率的に続きそうなテキスト」の出力です。

ChatGPTって結局何?できることやアカウント作成手順、質問の仕方を解説
(画像=GPT-3では、TransformerのDecoderというモデルが採用されています。大量のウェブページをクロールして得られたビッグデータをまず学習し、続けて「The capital of Germany」などの短い文書を与えます。正解は「is」であり、「Paris」や「Cat」をモデルが選択すると間違い。間違った選択肢を選んだらモデルにペナルティを与えるということを繰り返し、最終的に「The capital of Germany is Berlin」という文章を組み立てられるようになりました,『オトナライフ』より 引用)

InstructGPT

GPT-3には、出力される文章こそ自然ながら「人間の好みに合うアウトプットが得にくい」という問題がありました。GPT-3の学習元データは大量のWebページをクロールしたデータと言われており、そのなかには有害性の高いコンテンツや低品質ページも混在していたためです。

そこでOpenAIはRLHF(Reinforcement Learning from Human Feedback、人間のフィードバックを反映させた強化学習)という手法を取り入れ、2022年よりGPT-3の改良版である「InstructGPT」を提供開始。出力の精度はもちろん、回答の倫理面でも大きな改善が見られました。

ChatGPTはこの「InstructGPT」の延長線上にある技術と言え、いわば「対話特化型InstructGPT」のような存在です。

ChatGPTは何が画期的なの?

ここまでChatGPTの技術や画期性について触れてきましたが、それらをまとめると「3つの凄い点」が挙げられます。

圧倒的な汎用性

ChatGPTは日本語に対応しており、翻訳不要。さらに出力された文章が長すぎると感じた場合、「要約してください」と指示を出せばいいだけ。圧倒的な汎用性の高さが魅力となっています。自由に質問でき、なおかつその意図をChatGPTが汲み取ってくれるため、極めて広範な用途に使えます。文章生成からプログラミング、ビジネスプランの壁打ちから英語学習まで可能。ちなみにプロンプトを工夫すればノベルゲームとしてChatGPTを使ったり、トランプのブラックジャックなどもできたりします。

出力が人間の好みから外れる「アラインメント問題」を高度に解消

AIが人間の意図しない出力を行うことなどは「アラインメント問題」と呼ばれます。GPT-3の開発後、OpenAIは「InstructGPT」に取り組み、人間のフィードバック反映によってこの問題を高度に解消。

ChatGPTって結局何?できることやアカウント作成手順、質問の仕方を解説
(画像=2023年現在、提供されているChatGPTは受け答えも丁寧であり、回答そのものにも適切なフィルタリングやモデレーションの仕組みを導入。暴力や犯罪を助長してしまう回答が出力される可能性もゼロではありませんが、そうした不快な回答は非常に高度にコントロールされています,『オトナライフ』より 引用)

チャットインターフェースの導入

ChatGPTは、ユーザーと人工知能との会話を、チャットボックスのなかで表示します。チャットボックスは、ユーザーが普段使っているメッセージアプリやSNSと同じような見た目や操作感を持っています。そのため、ユーザーが友人や家族とメッセージをやりとりするような感覚で楽しむことができます。

ChatGPTって結局何?できることやアカウント作成手順、質問の仕方を解説
(画像=多くの人にとって、高度なAIモデルをローカル環境で動作させるのは技術的にもハード面でも難しいものです。高価なグラフィックボードなどが必要になってしまうケースも多く、なおかつ導入の難易度自体が高いためです。ChatGPTは極めて汎用的なAIモデルを、誰にとっても使いやすいシンプルなチャットインターフェースで導入したことが画期的であったと言えるでしょう,『オトナライフ』より 引用)

【実用面】非構造化データを活用しやすくなった

繰り返しにはなりますが、従来の自然言語処理では「翻訳モデル」「要約モデル」など用途ごとにファインチューニングを行う必要がありました。しかし、ChatGPTではファインチューニングなしでも与えられた情報を読み解き、「要約」「翻訳」「その文書の続きを作成する」など高度なアウトプットを生成できます。

この特性は、ビジネスシーンなどでも非常に役立ちます。たとえば「Slackでの膨大なやり取り」や「社内文書」など構造化されていない自然言語でのやり取りも、ChatGPTを介することで「要約」や「分類」などができます。

このほかにも、たとえば読みづらいプログラミングのコードも「各処理ごとにコメントを付けてください」などとすると、分かりやすく成形してコメントをつけてくれます。