AIとチャットできる技術が浸透してきましたが、そのほとんどは文章でのやり取りが一般的です。

しかし名古屋大学の研究チームはこのほど、まるで人間のようにスムーズな音声会話を実現する通話型AI「J-Moshi」の開発に成功したと発表しました。

AI音声アシスタントはこれまでにも存在していますが、それらは相手の発話が終わるのを待ってから応答するのが普通です。

一方で、私たちの普段の会話は、お互いの話が少し重なったり、相づちを入れたりしながら同時進行するものですよね。

J-Moshiはこうした自然な会話のやり取りを完全再現し、より流暢なコミュニケーションを可能にしたのです。

その驚きの会話の様子をぜひお聞きください。

研究の詳細は2025年3月10日〜14日に開催される「言語処理学会第31回年次大会(NLP2025)」において発表されます。

目次

  • 自然な音声会話ができるAIを開発!

自然な音声会話ができるAIを開発!

音声アシスタントやAIチャットボットは、私たちの生活にすっかり溶け込んでいます。

スマートフォンの音声アシスタントやカスタマーサポートのAIなど、さまざまな場面で利用されています。

しかし音声AIアシスタントを使った方ならわかるように、「会話のテンポが合わないな」とか「一方的に話しかけてる感じがする」と思うことが多いでしょう。

これは従来のAIが 「ターン制」 で会話を進めるためです。

要するに、人が話し終えるまで待ち、その後にAIが応答するという方式です。ポケモンのバトルと同じですね。

一見、理にかなっているように見えますが、私たちの日常的な会話では相づちやオーバーラップ(話の重なり)が重要な役割を果たしています。

例えば、友人との会話を思い浮かべてみてください。

あなた:「昨日、新しくできたレストランに行ったんだけど…」

友人:「えっ、どこ?美味しかった?」

あなた:「そうそう、すごく美味しくて…」