AI技術の発展が著しい近年。画像生成AIツールだけでなく、AIによってテキストをリアルタイムで音声変換する「Text-to-Speech AI」「CoeFont」などの音声生成AIツールが登場している。
音声生成AIツールのなかには、自然なイントネーションを実現するものや、ボイスチェンジャー機能で自分の声を著名人の声に変換するものがあり、誰もが人間の声と遜色ない音声を手軽に作成できるようになった。
しかし、AI音声技術の発展に伴い、AIによるフェイク音声を使った犯罪が国内外で発生している。世界7ヵ国(日本、米国、英国、ドイツ、フランス、インド、オーストラリア)の18歳以上の成人7,054人を対象とした調査では、10%が自身がAI音声詐欺に遭遇、15%が知人が遭遇したと回答した。
こうした“ディープフェイク・ボイス”犯罪への対策が求められるなか、米国に本社を構えるValidsoftは、ディープフェイク・ボイスを検知する認証ソリューションを提供している。
音声ベースの認証ソリューションを展開するValidsoft

Image Credits:Validsoft
ValidsoftのCEOかつ設立者であるPat Carroll氏は、金融と情報技術の分野において25年の実績を持つベテランだ。過去にはGoldman Sachs、J.P. Morgan、Credit Suisseなどの金融グループで上級職を務めたという。
そのほかValidsoftでは音声テクノロジーを専門とする博士や、コンプライアンスや法務の専門家といった錚々たる面々が在籍している。各分野のスペシャリストとの協力により同社は急速な成長を遂げており、現在は本社を置く米国のほか英国、インドでもサービスを展開している。
会話もできる“ディープフェイク・ボイス”とは
PINやパスワードの代わりに、音声や指紋などの“生体認証”が採用されるようになったのは、ここ数年のことであり、まだ十分なセキュリティ技術が追いついていないという。
ディープフェイクの中には、人間が識別できないほどのリアルなフェイクが生成されるケースも少なくない。2019年には、WSJでフェイクボイスによる詐欺事件が報告され、波紋を呼んだ。
その事件の内容はこうだ。英国の某エネルギー会社のCEOは、上司であるドイツの親会社のCEOから電話で「緊急に資金をハンガリーの取引先に送金するように」と指示されたという。指示に従い、22万ユーロ(約24万3000ドル)を振り込んだところ、送金を要求した声の主は声ディープフェイク・ボイスによるものだったのだ。
こうしたディープフェイク・ボイスには、膨大な音声データと入念なトレーニング・機械学習を経て、音声を合成する「ボイススキン技術」が使われている。ボイススキン技術は録音とは異なり、本人の声に近い音声でターゲットと会話をすることも可能だという。