AIのトレンドをしっかり捉えたマルチモーダル能力の向上

 川崎氏が3つ目の特徴として挙げたのは、マルチモーダル能力の向上だ。マルチモーダルとは、テキストだけでなく、画像や音声など、複数の異なる種類の情報を統合的に扱える能力を指す。

「ただし、正直なところ、この点に関しては、ここ数か月で他のモデルも同様の機能を発表・強化しており、Llama 4が突出して新しいというわけではありません。しかし、着実に進化しているという印象です。他社が先行している部分もあるかもしれませんが、Meta社もキャッチアップし、中堅どころ、あるいはそれ以上のポジションを確立しつつあると言えるでしょう」

 最近のAIモデルのトレンドとして、このマルチモーダル対応は非常に重要視されており、Llama 4独自の進化というよりは、「AI業界のトレンドにしっかり押さえている」と言ったほうがいいだろう。