音声読み上げソフトが技術的特異点を迎えつつあるようです。

英国Sonantic社はバレンタインデーにあわせて、AI音声技術で作られたリアルな音声作品を公開しました。

同社が開発した音声技術は、セリフの間の呼吸音やため息などを自在に組み込むことが可能であり、機械音声にありがちな単語の終わりの違和感が存在しません。

さらに打ち込んだセリフに対して「怒り」「恐れ」「幸福」「悲しみ」など複数の演出設定が可能であり、単調な読み上げソフトとは異なる、感情的な声の演出が可能になっています。

リアルな機械音声には、いったいどんな細工がなされているのでしょうか?

目次
声優並に超リアルな演技をするボイスロイドの動画
実際にデモで遊んでみよう

声優並に超リアルな演技をするボイスロイドの動画

現在、インターネット上にはテキストとして打ち込んだ文字を読み上げてくれる「音声読み上げソフト」で作られた膨大な数の動画が存在します。

読み上げソフトを用いることで、作者は動画の内容を人の声を通して伝えることができるようになりました。

また複数のソフトを利用することで、キャラクター同士の会話も可能になり、動画の演出に人間同士の会話のようなテンポを生み出すことが可能になります。

かつての読み上げソフトは機械音声まる出しの違和感ある声しか出すことができませんでしたが、ここ10年あまりの技術進歩により、より人間の声質に近い表現が行えるようになってきました。

しかし既存の読み上げソフトは「読み上げ」が主な目的であり、その声は主として中立的・事務的であり、感情のこもった演技は不得意でした。

また読み上げられる単語と単語の間に微妙な違和感が存在しており、なめらかさに欠けています。

そのため読み上げソフトと人間の本物の声の判別は容易でした。

ですがSonantic社によって開発されたAI音声は、人間なのか機械なのか、その声を判別することが非常に困難です。

バレンタインデーにあわせて公開された上の動画では、聞こえてくる女性の声は全て機械音声です。

しかしあまりにリアルであるため、人間の声そのもののように聞こえます。

新たに開発された音声ソフトは、AI技術を用いることで、これまでの読み上げソフトが苦手としてきた自然な単語の連結を可能としています。

そのため利用者は今まで通り文章を打ち込むだけで、より自然な音声を作成することが可能になるのです。

また既存の読み上げソフトは入力された文章に対して常に同じ調子でしか発音がされませんが、Sonantic社が開発したAI音声は同じ文章に対して「怒り」「恐れ」「幸福」「悲しみ」「表現力豊か(自然な読みあげ)」など複数の演出設定がワンクリックで選択できるようになっています。

さらにスピーチの抑揚、速度、音量の調節はもちろん「呼吸音」「溜息」「笑い声」など非言語的な表現を、単語と単語の間に自由に挟み込むことで、泣きながら言葉をつづる女の声、怒りながら罵声を浴びせる野太い男の声、怯える少女の声など、既存の読み上げソフトに不足している感情表現が可能になりました。

Sonantic社は開発されたAI音声ソフトを用いることで、フルボイスのゲーム開発や映画作成を、極めて安価かつ少人数で作成可能になると述べています。

もし同じ性能をもった「演技ソフト」が出回るようになれば、誰もが自分の好みのセリフを自然な音声で作ることが可能になるでしょう。

しかし機械音声の隆盛は、声優業界にとっては痛手となるかもしれません。

声優の声の解析をして、その再現が自動化されれば、全ての音声が機械で作られたアニメやゲーム、映画の作成も可能になるからです。

今後、声優たちは自らの声の著作権(演技や声質の解析や再現の規制)に、いままで以上の注意を払う必要が出てくるかもしれません。

実際にデモで遊んでみよう

現在、Sonantic社は音声AIのデモをネット上に公開しています。

利用方法はまずSonanic社のサイトである「sonantic.io」のページに飛んで一番下までスクロールします。

声優並に超リアルな演技ができるボイスロイドが登場しつつある
(画像=サイトに飛んで一番下に行くとデモ画面が現れる / Credit:Sonantic、『ナゾロジー』より引用)

すると上の図のようなデモ画面が現れます。

デモの使い方はいたって簡単であり、下線部分の英語を削除して好きなセリフ(ただし英語)を打ち込み、上に表記された5つの感情モードから好きなものを選び、再生ボタンを押すだけ。

完成したセリフは全て「All work and no play」という単語に続けて発音されるようになっているため、前にコンマを4つほど打ち込むと、自分が入力したセリフが認識しやすいと思います。

声優並に超リアルな演技ができるボイスロイドが登場しつつある
(画像=実際に「,,,May the Force be with you(フォースと共にあれ)」を打ち込んでみました / Credit:Sonantic、『ナゾロジー』より引用)

ちなみにナゾロジーではスターウォーズで有名なセリフである「,,,May the Force be with you(フォースと共にあれ)」や「,,,,You were my brother, Anakin. I loved you(お前は兄弟だったアナキン、お前を愛していた)」を打ち込んでみました。

残念ながら40文字の制限があるため、2つめのセリフは最後の「you」が欠けてしまいましたが、かなり自然な音声が確認できました。

もし興味があれば、好きな映画のセリフを出力させて遊んでみるといいかもしれません。


参考文献

AI VOICES:STUNNING REALISM, CAPTIVATING EMOTION


提供元・ナゾロジー

【関連記事】
ウミウシに「セルフ斬首と胴体再生」の新行動を発見 生首から心臓まで再生できる(日本)
人間に必要な「1日の水分量」は、他の霊長類の半分だと判明! 森からの脱出に成功した要因か
深海の微生物は「自然に起こる水分解」からエネルギーを得ていた?! エイリアン発見につながる研究結果
「生体工学網膜」が失明治療に革命を起こす?
人工培養脳を「乳児の脳」まで生育することに成功