SyncWaveXの目玉は、さまざまな音声に対して人物の唇の動きをシームレスに一致させるリップシンク技術だが、それ以外にも高度な技術を備えている。
例えば、加工用の元動画・画像内の顔を正確に検出できる「顔認識テクノロジー」だ。眉毛・頬・鼻・唇など個人の顔の動き全体を細かくキャプチャし、リアルに再現する。さらに、SyncWaveXは音声合成・認識テクノロジーも統合しており、個人の音声特性に基づいてモデルをトレーニングし、元の話者に非常によく似た音声を合成することも可能だ。
こうした技術により、ユーザーはアップロードした音声や動画をカスタマイズされた“AIデジタルヒューマン”に変換できるようになる。
誰もが自身の“デジタルレプリカ”を持てる未来へ
GDCは米国の完全子会社であるAI Catalysisと、上海のShanghai Xianzhui Technology Co, Ltd.を通じて事業を行う持株会社。NASDAQ市場へ上場を果たしたグループであり、近年ビジネスを拡大している。
今回、GDCとともにSyncWaveXを発表したAI Catalysisは、2023年に設立されたテック企業。主に広告、電子商取引、音楽、動画制作にAIテクノロジーを適用することに注力している。現在は個人・企業向けの品質・効率・コスト効率を向上させるAIソリューションを提供中だ。
GDCの会長兼CEOであるXiaojian Wang氏は「今回のSyncWaveXの発表は、単なる新しいツールの紹介ではない。誰もが無限の可能性を秘めた自分自身のデジタルレプリカを持つことができる未来への道を切り開くものだ」とコメントしている。
(文・Haruka Isobe)