笑顔の兆候を察知し、相手と同時に笑顔を作るロボット「エモ」

研究チームによると、表情でコミュニケーションを行えるロボットの設計には、2つの課題があるようです。

1つは、「表情豊かな顔を機械的に設計すること」であり、もう1つは「自然で本物らしく見えるよう、適切なタイミングで、どのような表情を生成するか教えること」です。

研究チームが開発した頭部のみの人型ロボット「エモ」は、これらの2つの課題に取り組んでいます。

非言語コミュニケーションに挑んだ「エモ」
非言語コミュニケーションに挑んだ「エモ」 / Credit:Courtesy of Creative Machines Lab_Robot, can you say ‘Cheese’?(2024)

エモには26個のアクチュエーターが装備されており、様々な表情を作り出すことができます。

人間のように表情の微妙な違いも再現できるのです。

またエモの両目には、高解像度カメラが取り付けられており、非言語コミュニケーションに必要なアイコンタクトを取ることもできます。

そしてチームは、まずエモに表情の作り方を学習させるため、エモをカメラの前に置き、ランダムな動きをさせました。

これを数時間続けることで、エモは、どの運動コマンドの組み合わせが、どんな表情を生み出すかを学習することができました。

このプロセスは、研究チームが「セルフモデリング(self modeling)」と呼んでいるものであり、人が鏡の前で笑顔の作り方を練習することに似ています。

次にチームは、エモに人間の表情に関する動画を見せ、フレームごとに分析させました。

このトレーニングが数時間行われると、エモは人の顔の僅かな動きを察知し、それがどんな表情に繋がるか予測できるようになりました。

笑顔を事前に察知し、同時に微笑むことが可能
笑顔を事前に察知し、同時に微笑むことが可能 / Credit:Yuhang Hu(Columbia University)et al., Science Robotics(2024)

実際にエモは、対面した人間の笑顔を約840ミリ秒前に予測し、相手の笑顔と同時に自分も笑顔で応答できました。

「相手の表情を予測して、自分の表情も瞬時に変化させる」能力は、人間に限りなく近いコミュニケーション能力だと言えるでしょう。

では、この顔の動作によって、エモは「不気味の谷」を越えることができたのでしょうか。

私たちがエモを見て感じているように、それはまだ難しいようです。

私たちと同時にエモが笑顔になると、「エモに親しみを感じる」というよりも、怖くなってしまいますね。

とはいえ、ユハン・フー氏が、「人間の表情を正確に予測することは、人とロボットの関わり合いにおける革命です」と述べるように、この成果は、人型ロボットとの表情を介した対話における課題の一つである反応性の問題をクリアするのに役立つはずです。

ロボットの動作や外見、反応の自然さを一歩ずつ人間に近づけていくなら、いずれ人々から好感を持たれる「限りなく人間に近いロボット」を作ることができるはずです。

研究チームは、次のステップとして、このエモにChatGPT のような言語モデルを組み込んで、表情と言語を組み合わせたコミュニケーションを作り出す予定です。

参考文献

Robot, can you say ‘Cheese’?

Emo senses your smile before it happens and responds in kind

元論文

Human-robot facial coexpression

ライター

大倉康弘: 得意なジャンルはテクノロジー系。機械構造・生物構造・社会構造など構造を把握するのが好き。科学的で不思議なおもちゃにも目がない。趣味は読書で、読み始めたら朝になってるタイプ。

編集者

海沼 賢: ナゾロジーのディレクションを担当。大学では電気電子工学、大学院では知識科学を専攻。科学進歩と共に分断されがちな分野間交流の場、一般の人々が科学知識とふれあう場の創出を目指しています。