目次
人間が入力したテキストの意図をくみ取って画像生成してくれる

人間が入力したテキストの意図をくみ取って画像生成してくれる

DALL·E2は入力された文章を理解し、画像をいくつか生成してくれます。

例えば、冒頭で挙げた「鉛筆で書かれた 馬に乗っている 宇宙飛行士」であれば、次の通りです。

無茶振りテキストから希望通りの画像を生成する「スゴイAI」
(画像=DALL·E2がテキストから生成した画像「鉛筆で書かれた 馬に乗っている 宇宙飛行士」 / Credit:OpenAI,『ナゾロジー』より 引用)

「食料品を買っている テディベアの 浮世絵」であれば、こんな画像。

無茶振りテキストから希望通りの画像を生成する「スゴイAI」
(画像=DALL·E2がテキストから生成した画像「食料品を買っている テディベアの 浮世絵」 / Credit:OpenAI,『ナゾロジー』より 引用)

「粘土で作られた モンスターみたいな 一杯のスープ」のように、まったく統一感のないテキストからも画像を生成可能です。

無茶振りテキストから希望通りの画像を生成する「スゴイAI」
(画像=DALL·E2がテキストから生成した画像「粘土で作られた モンスターみたいな 一杯のスープ」 / Credit:OpenAI,『ナゾロジー』より 引用)

またDALL·E2は、既存の画像の影や反射、テクスチャを考慮しつつ、自然に編集してくれます。

例えば、下記の美術館の画像。

無茶振りテキストから希望通りの画像を生成する「スゴイAI」
(画像=異なったタイプの絵画が並ぶ美術館 / Credit:OpenAI,『ナゾロジー』より 引用)

この絵のどこかに犬を追加したい場合、DALL·E2は追加する場所によって描写方法を調整し自然に馴染ませることができるのです。

無茶振りテキストから希望通りの画像を生成する「スゴイAI」
(画像=追加する場所で絵のタッチが変化する / Credit:OpenAI,『ナゾロジー』より 引用)

上の画像を見ると分かる通り、絵画のタッチの違い、また絵画とリアルの違いを理解して、自然な形で犬を追加しています。

さらにDALL·E2は、オリジナル画像に似た(インスピレーションを受けた)画像も複数生成できます。

無茶振りテキストから希望通りの画像を生成する「スゴイAI」
(画像=(左)オリジナル, (中・右)オリジナルを元に生成した画像 / Credit:OpenAI,『ナゾロジー』より 引用)

使い方によっては怒られそうなので、ちょっと注意が必要ですね。

ちなみに、暴力的・政治的・アダルト画像の生成には制限がかかっているとのこと。

DALL·E2は、今のところ研究者向けに提供されるので、私たちがすぐに利用できるわけではなさそうです。

とはいえ、「テキストからハイレベルな画像を生成できるAI」は既に存在しています。

もしかしたら今後、私たちの身の回りには、AIが生成した画像が溢れるのかもしれません。


参考文献

DALL·E 2 is a new AI system that can create realistic images and art from a description in natural language.

AMAZING NEW AI CAN SPIT OUT REALISTIC IMAGES FROM SIMPLE DESCRIPTIONS


提供元・ナゾロジー

【関連記事】
ウミウシに「セルフ斬首と胴体再生」の新行動を発見 生首から心臓まで再生できる(日本)
人間に必要な「1日の水分量」は、他の霊長類の半分だと判明! 森からの脱出に成功した要因か
深海の微生物は「自然に起こる水分解」からエネルギーを得ていた?! エイリアン発見につながる研究結果
「生体工学網膜」が失明治療に革命を起こす?
人工培養脳を「乳児の脳」まで生育することに成功