1人の声だけを選択的に聞き取るノイズキャンセリングヘッドホン
ゴラコタ氏ら研究チームは、AIを活用することでノイズキャンセリングと会話の両立を可能にしました。
ゴラコタ氏は、この点を次のように語っています。
「現在、AIは質問に回答するチャットボットだと考えられがちです。
しかし、このプロジェクトでは、ヘッドホンを装着している人の聴覚を、その人の好みに応じて変更するAIを開発しました。
私たちのデバイスを使用するなら、騒がしい環境で大勢の人が話していても、1人の話者の声をはっきりと聞き取れるようになります」
そのAIシステムを利用したへッドホンを装着し、話している相手にまっすぐ顔を向けながらボタンを押すと、「登録」プロセスが開始されます。
相手に顔を向けるということは、話者が発する音波がヘッドホンの両側のマイクに同時に届くということです。(誤差は16度まで)
これにより、ヘッドホンは話者特有の音声パターンを学習。相手の声を捉えることができます。
この登録プロセス全体にかかる時間はわずか3~5秒です。
登録後はシステムが話者の声を捉え続けるので、自分と相手が顔を動かしたり、動き回ったりしても、周囲の騒音を抑えつつ、相手の声だけははっきりと聞こえるようにしてくれます。
しかも登録された相手が話し続けることで、システムがさらに多くのデータを収集。声を捉える能力が向上するのだとか。
以下のビデオから、実際にどのように聞こえるか試してみてください。
最初は後方にいる人の声(雑音)により話者の話を聞き取りづらい(動画 1:05~)ですが、システムをONにすることで、雑音がほとんど聞こえなくなり(動画 1:15~)、話者の声だけがはっきりと聞き取れます。
そして研究チームは、このヘッドホンをテストするため、21人の参加者と共に実験を行いました。
参加者は、野外または室内の環境でヘッドホンを使用し、420分以上かけて話者の声の明瞭度を評価しました。
その結果、参加者たちは、新システムを使用する場合に、使用しない場合と比べて、話者の音声の明瞭度を約2倍も高く評価しました。
新しいヘッドホンを使用するなら、どんなに騒がしい環境でも、周囲の騒音に気を散らされることなく、相手とじっくり会話を楽しむことができるのです。
この機能は、カフェのテラス席や騒がしいレストラン、居酒屋などで活躍することでしょう。
将来的には、ヘッドホンだけでなくイヤホンや補聴器にも応用される予定であり、より一般的になるだけでなく、難聴者や高齢者が特定の人の声を聞き取りやすくなるはずです。
とはいえ、現段階では限界も抱えています。
このヘッドホンは1度に1人の話者しか登録することができません。
また、話者と同じ方向から大きな別の音が鳴り響いている場合、話者の声を正確に登録することができません。
それでも新しいシステムは、私たちの生活をより便利にしてくれる可能性を秘めており、今後の進展と改良に期待できます。
参考文献
AI headphones let wearer listen to a single person in a crowd, by looking at them just once
元論文
Look Once to Hear: Target Speech Hearing with Noisy Examples
ライター
大倉康弘: 得意なジャンルはテクノロジー系。機械構造・生物構造・社会構造など構造を把握するのが好き。科学的で不思議なおもちゃにも目がない。趣味は読書で、読み始めたら朝になってるタイプ。
編集者
海沼 賢: ナゾロジーのディレクションを担当。大学では電気電子工学、大学院では知識科学を専攻。科学進歩と共に分断されがちな分野間交流の場、一般の人々が科学知識とふれあう場の創出を目指しています。