テキストを入力することで、自動的に画像を生成してくれる画像生成AI。多くのサービスやアプリ、また生成された画像のギャラリーなどが存在しています。
どのようなサービスやアプリがあるのか、そしてユーザーコミュニティなど、画像生成AIに関する様々なサイトをまとめてみました。
画像生成AIの仕組みは、希望する画像の要素を「プロンプト」と呼ばれるテキストで入力すると、AIがネットや事前に登録されている画像の中から求められる要素を抽出し、整合させて1枚の画像として生成(出力)するというもの。サービスによって、要素の抽出や整合させる過程に特色があり、求める画像の方向性によって使い分けると便利です。
■ AI画像生成サービス
▼ 日本で人気のNovelAI
日本で人気なのが、アメリカのAnlatanが提供している「NovelAI」。その名の通り、もともとはOpenAIが開発した学習モデルGPTを利用して小説(Novel)など文章を生成するAIサービスとしてスタートしました。

何もない状態から作り始めることもできますが、ダークファンタジーやドラゴンといったテーマのプリセット、コナン・ドイルやラヴクラフトのような作家の作風がプリセットとして用意されており、テキストで指示することによって「コナン・ドイルが剣と魔法のファンタジー小説を書いたら」といったお遊びも可能となっています。
これに挿絵を生成するサービス(NovelAI Diffusion)が加わったのですが、いわゆる「ラノベ風」のイラストを作りやすいのが特徴。もちろんリアル寄りのイラストも生成可能です。またテキストだけでなく「Image2Image」と呼ばれる、アップロードした画像をもとに別の画像を生成することも可能です。
画像生成に関しては「Stable Diffusion」のアルゴリズムをベースとし、そこに独自の改良を加えたモデルを採用。2023年3月22日には、AI用のシステムとしてNVIDIAのDGX H100の導入を発表し、完全自社開発のAIモデルに移行する予定であることも明らかにされました。
学習元がネット上で公開されているすべての画像となっているため、ほかの人の著作物を学習に利用しているとの指摘があり、生成画像には「AIトレパク」や「贋作」の疑惑がつきまといます。Anlatanは、生成されたコンテンツを公開するベンダーやプラットフォームにはならないと宣言しており、商用利用に関して否定的な立場をとっています。
・出典:Novel AI
▼ 世界的にユーザーの多いStable DiffusionとMidJourney
世界的にユーザーの多いサービスとしては「Stable Diffusion」や「MidJourney」が挙げられます。どちらも2022年に公開されました。
「Stable Diffusion」はミュンヘン大学のグループが開発したもので、コードやウェイトがGitHubで公開されており、オンラインのほかローカルの環境で実行することも可能。これを基礎として、さまざまな画像生成AIモデルが開発されています。AndroidとiOSに対応したモバイルアプリも提供されています。
プロンプトのデータベースやジェネレータもあり、初心者でもとっつきやすいかもしれません。2023年3月現在、バージョン2.1がテスト中です。

NovalAIの項でも述べた通り、Stable Diffusionの学習モデルはネット上にある画像を学習元としているため、著作権侵害の可能性が議論されています。公式サイトでは「オンライン版のStable Diffusionで生成された画像は完全にオープンソース」としていますが、使用に際しての著作権については「複雑で、法の領域によって解釈が異なる」と、商用利用する際にはリスクがあることを示唆しています。
・出典:Stable Diffusion