●この記事のポイント ・米グーグル、インターネット接続が不要でスマホ上で動作するAIモデル「Gemma 3n」を公開 ・ユーザーのプライバシーが尊重され、日本語を含む多言語に対応 ・テキスト自動生成、リアルタイム音声文字変換、翻訳、高度な音声駆動型インタラクションなどの機能を提供
米グーグルが公開した、インターネット接続が不要でスマートフォンやタブレット、ノートパソコン上で動作するAIモデル「Gemma 3n」が話題を呼んでいる。現在はまだプレビュー版であり、AndroidやChromeなどで利用できるようになり、年内にはGoogleアプリなどさまざまな場所で利用できるようになる予定。ネット接続ができない状況でもローカルで実行でき、かつユーザーのプライバシーが尊重され、日本語を含む多言語に対応しているのが特徴。オーディオ、画像、動画、テキスト入力を組み合わせてテキストを生成したり、リアルタイム音声文字変換、翻訳、高度な音声駆動型インタラクションなどの機能を利用することができる。現在、「Google AI Edge Gallery」上でツールとライブラリが提供されている。実際に使用した専門家への取材を交えて、性能や使用感をお伝えしたい。
●目次
## 数回のタップでAIモデルを端末に導入して試せるすでにグーグルの「Gemini」やOpenAIの「ChatGPT」は広く使われているが、高度な処理をするためにAIモデルは提供事業者のサーバー環境に置かれており、ユーザーはネット経由で利用する。Gemma 3nはネット接続が不要なので、どこでも利用できる点が大きな特徴だ。一方、サーバーよりも低スペックのスマホやノートPC上で駆動するため性能面が気になるところだが、グーグルはQualcomm Technologies、MediaTek、Samsung System LSIなどのモバイルハードウェア企業と密に連携してGemma 3nを開発し、超高速なマルチモーダル AI向けに最適化されているという。RAM 使用量を大幅に削減する「Per-Layer Embeddings(PLE)」というGoogle DeepMindのイノベーションを活用し、「Gemma 3 2B」や「Gemma 3 4B」のモデルに匹敵するメモリ オーバーヘッドで、それよりも大きなモデルを実行できるという。
実際に使用したシステムエンジニアでライターの伊藤朝輝氏はいう。
「Google AI Edge Galleryは、グーグルが開発したスマートフォン上でさまざまなAIモデルの実行環境を提供するアプリです。『オンデバイスAI』なのでインターネットに接続しなくても画像解析やテキスト生成などのAIタスクがこなせ、完全に端末上で動作することから、ユーザープライバシー保護の観点でも優秀です。ただこれは、オンデバイスAIの一般的な特徴です。真にGoogle AI Edge Galleryが画期的なのは、アプリ名に『Gallery』とあるように、いくつかのAIモデルを手軽に選んで使えるようになっている点だと思います
現時点では、どのように利用するのか。
「ギャラリーから画像解析、テキスト要約・コード生成、チャット形式でのQ&Aなどの機能を持つAIモデルをダウンロードし、端末上で利用できます。ユーザーが用意したAIモデルを導入して動作させる機能も用意されています。多少の知識は必要ですが、数回のタップでAIモデルを端末に導入して試せる点が大きなメリットです」