米Google(グーグル)は9日、AI向け半導体・TPU(Tensor Processing Unit)の第7世代「Ironwood」を発表。AIモデルが「応答型」から「推論型」にシフトする流れに対応し、LLM(大規模言語モデル)、Mixture of Experts(MoE)、高度な推論タスクを含む「思考モデル」の複雑な計算とコミュニケーション要求を円滑に管理できるように設計されている点が特徴。なかでも消費電力が従来より半減される点が注目されているが、グーグルがTPUの消費電力削減に重きを置く理由は何か。また、半導体の消費電力が削減されると、どのような効果が生じるのか。専門家の見解を交えて追ってみたい。
Ironwoodは生成AI開発向けに構築されており、最大9216個の液冷チップをチップ間相互接続(ICI)ネットワークに接続でき、約10MWまで拡張可能。大規模なテンソル操作を実行しながら、チップ上のデータ移動とレイテンシ(データ転送に伴う遅延時間)を最小限に抑制。完全なTPUポッド規模で連携、および同期されたコミュニケーションをサポートするために、低レイテンシ、高帯域幅のICIネットワークを備えている。
なかでも注目されているのが、大幅な電力効率の向上だ。2024年に発表された第6世代TPU「Trillium 」と比較して2倍の消費電力あたりのパフォーマンスを発揮。ワークロードに対する1ワットあたりの能力が大幅に向上しており、高度な液冷ソリューションと最適化されたチップ設計により、継続的な高負荷のAIワークロード下でも、標準的な空冷の最大2倍のパフォーマンスを安定して維持できる。2018年の初代TPU と比べて電力効率が約30倍優れているという。
エヌビディアより優れた半導体が必要な理由
グーグルは検索エンジンやクラウドサービス「Google Cloud(グーグルクラウド)」、生成AIモデル「Gemini」、「Google Workspace」などを提供するインターネットサービス企業、ソフトウェア企業として知られているが、なぜ自社で半導体を製造しているのか。国際技術ジャーナリストで「News & Chips」編集長の津田建二氏はいう。
「グーグルクラウドのクラウドサービスを運営する上で重要なデータセンターには、AI開発に使える高性能なコンピュータを大量に設置する必要があり、そのなかで使う高性能なCPUを開発しておく必要があります。コンピュータの性能を大きく左右するCPUは消費電力も大きく、より消費電力を抑えた半導体、その面ではエヌビディアより優れた半導体が必要だということで、グーグルは自社開発を行っているのだと考えられます」