ChatGPTとは人工知能が人間の投げかけに対し、自然な回答や文章を生成するサービスです。しかし、結局ChatGPTはなにができるのか、きちんと把握できていない方も少なくないのではないでしょうか。
この記事ではChatGPTの特徴やできること、アカウント作成手順、質問の仕方などを詳しく解説します。
ChatGPTとは?
大規模言語モデル(LLM)を用いた生成AI
ChatGPTを技術面から簡潔にまとめると「対話特化型の汎用性が高い大規模言語モデル(LLM)」です。大規模言語モデル(LLM)と従来の自然言語処理の違いは、以下の画像の通り。なお大規模言語モデル(LLM)の例として、GPT-3を従来の自然言語処理と比較しています。
ChatGPTで使われている技術
ChatGPTで使われている技術には様々なものがありますが、とくにブレークスルーとなったのは「GPT-3」。この技術をベースに、OpenAIが「InstructGPT」の研究も強力に推し進めたことで、ChatGPTの高品質な受け答えが実現されています。
GPT-3
GPT-3は2020年に発表された自然言語技術処理モデルの1つ。ちなみに、その1つ前のバージョンである「【リンク:公式URL】GPT-2【/リンク:公式URL】 」は2019年にオープンソースで配布されています。
GPT-3の最大の特徴は、先にも述べた通り「確率的に続きそうなテキスト」の出力です。
InstructGPT
GPT-3には、出力される文章こそ自然ながら「人間の好みに合うアウトプットが得にくい」という問題がありました。GPT-3の学習元データは大量のWebページをクロールしたデータと言われており、そのなかには有害性の高いコンテンツや低品質ページも混在していたためです。
そこでOpenAIはRLHF(Reinforcement Learning from Human Feedback、人間のフィードバックを反映させた強化学習)という手法を取り入れ、2022年よりGPT-3の改良版である「InstructGPT」を提供開始。出力の精度はもちろん、回答の倫理面でも大きな改善が見られました。
ChatGPTはこの「InstructGPT」の延長線上にある技術と言え、いわば「対話特化型InstructGPT」のような存在です。
ChatGPTは何が画期的なの?
ここまでChatGPTの技術や画期性について触れてきましたが、それらをまとめると「3つの凄い点」が挙げられます。
圧倒的な汎用性
ChatGPTは日本語に対応しており、翻訳不要。さらに出力された文章が長すぎると感じた場合、「要約してください」と指示を出せばいいだけ。圧倒的な汎用性の高さが魅力となっています。自由に質問でき、なおかつその意図をChatGPTが汲み取ってくれるため、極めて広範な用途に使えます。文章生成からプログラミング、ビジネスプランの壁打ちから英語学習まで可能。ちなみにプロンプトを工夫すればノベルゲームとしてChatGPTを使ったり、トランプのブラックジャックなどもできたりします。
出力が人間の好みから外れる「アラインメント問題」を高度に解消
AIが人間の意図しない出力を行うことなどは「アラインメント問題」と呼ばれます。GPT-3の開発後、OpenAIは「InstructGPT」に取り組み、人間のフィードバック反映によってこの問題を高度に解消。
チャットインターフェースの導入
ChatGPTは、ユーザーと人工知能との会話を、チャットボックスのなかで表示します。チャットボックスは、ユーザーが普段使っているメッセージアプリやSNSと同じような見た目や操作感を持っています。そのため、ユーザーが友人や家族とメッセージをやりとりするような感覚で楽しむことができます。
【実用面】非構造化データを活用しやすくなった
繰り返しにはなりますが、従来の自然言語処理では「翻訳モデル」「要約モデル」など用途ごとにファインチューニングを行う必要がありました。しかし、ChatGPTではファインチューニングなしでも与えられた情報を読み解き、「要約」「翻訳」「その文書の続きを作成する」など高度なアウトプットを生成できます。
この特性は、ビジネスシーンなどでも非常に役立ちます。たとえば「Slackでの膨大なやり取り」や「社内文書」など構造化されていない自然言語でのやり取りも、ChatGPTを介することで「要約」や「分類」などができます。
このほかにも、たとえば読みづらいプログラミングのコードも「各処理ごとにコメントを付けてください」などとすると、分かりやすく成形してコメントをつけてくれます。