入力した文字や文章を即座に音声に変換するAIツール、TTS。「TTS」は「Text‐To‐Speech」の略で、日本語では「読み上げ音声AI」や「テキスト読み上げ音声合成ツール」などと呼ばれる。
グローバル化に伴いニーズの高まる多言語通訳や、障がい者のコミュニケーションツールとしての役割が期待される技術で、DATA Bridge Market Researchによると世界のTTS市場は2029年までに$170億ドル(約2.2兆円)規模に成長するとの見通しだ。
2024年3月時点ですでに数多くのTTSツールがオンラインで利用可能だが、「Listnr」はカスタマイズ性の高さと使いやすさが特徴。142か国語に対応し1000種類以上の音声タイプから選択可能で、自分の声のクローンも生成でき、TikToksやYoutube、PodcastsへのAPI機能も充実している。
シンプルで使いやすいAI音声、リアルな人間の声が1000種類以上
Listnerが他のTTSツールと異なるのは、実在する人間の声が採用されている点だ。すべての声には提供者がいて、声の所有権は提供者に属している。
各自が自分の声をListnrに登録するシステムで、登録済みの音声は142か国語1000種類以上に及ぶ。豊富な言語・声の種類からユーザーの目的やイメージに合ったものが選べるようになっているのだ。

Image Credits:Listnr
サイト上では140字までだが、メールアドレスの登録またはGoogleアカウントでListnrにログインすれば1000単語/月の無料プランを利用できる。使い方はじつにシンプル。音声にしたい文章を画面に入力して、希望する音声のイメージを設定するだけだ。後は本物の人間が読み上げたようにナチュラルな音声をAIが生成してくれる。

Listnrにログインした状態。Image Credits:Listnr

エディター画面。Image Credits:Listnr
有料プランは1~99ドルの4種類があり、いずれも1000単語/月までは無料で使用可能。金額に比例して利用できる機能や使用可能な単語数も多くなる。例えば、実際にマルチリンガルである人物の音声を選択して、多国籍な発音を再現することもできる。設定できるキャラクターの選択肢も増え、よりイメージに近い音声でナレーションやコミュニケーションの質を高めていけそうだ。
他に、画像や文章のURLを添付するだけで音声に変換できるボイスオーバー(自動通訳&音声)機能も。現時点ではYoutube、TickTock、Podcastと連携済みで、APIで簡単に接続できる。