言語翻訳、メールフィルター、文字変換予測、検索エンジンなどには、人間の言語を理解するAIが利用されており、それは「自然言語処理(略称:NLP)アルゴリズム」と呼ばれます。
アメリカ・マサチューセッツ工科大学の人工知能研究所に所属するボニー・バーガー氏ら研究チームは、1月15日付けの科学誌『Science』にて、NLPアルゴリズムを用いてウイルスの突然変異を予測できると発表しました。
ウイルスの突然変異は現在進行形で私たちを苦しめていますが、「文を読むAI」の応用が素早い対応を可能にするかもしれないのです。
目次
自然言語処理(NLP)の特徴
NLPアルゴリズムでウイルスの突然変異を予測する
自然言語処理(NLP)の特徴
通常、人間はコンピュータに対して、コンピュータ言語で指示を出します。
人間の言葉は非常に複雑なので、単純明快なコンピュータ専用の言語に訳して理解させているのですね。
しかし最近では、スマホに「近くのレストレランを探して」と、直接人間の言葉で語りかけ、理解してもらうことができています。
このように人間の言語を処理する機能が「自然言語処理(NLP)」であり、簡単に言うと「人間の文を理解するAI」とも言えるでしょう。
NLPアルゴリズムが人間の言語を理解できるのは、文章の「文法」や「意味」を把握できるようプログラムされているからです。
例えば、AIに「あめがふる」という文が入力されると、「あめ / が / ふる」という文法的正確さの観点で解釈されます。
また、「あめ」には「雨」と「飴」の2つの意味がありますが、文の構成から正しい意味を探ろうとします。
もちろん、実際のNLPアルゴリズムはもっと複雑ですが、これら2つの言語概念は、確かに文を理解するために重要な要素だと分かります。
そして研究チームは、「文を理解するAI」が持つ「文法」と「意味」の言語概念を、ウイルスの突然変異を予測するのに役立てようと考えました。
NLPアルゴリズムでウイルスの突然変異を予測する
ウイルスはある部分を突然変異させて、人間の免疫系をすり抜けることができます。
もちろん、一度ウイルスに感染した人には免疫ができ、同じウイルスの侵入をブロックしてくれます。
しかし、ウイルスの一部が突然変異することで、免疫は同じウイルスだとは認識できず、再び体内への侵入を許してしまうのです。
このようなウイルスの変異は複雑であり、その仕組みはタンパク質配列や遺伝子コードから知ることができます。
そして研究チームは、ウイルスのタンパク質配列が人間の文章と類似しており、その特性はNLPの「文法」と「意味」の言語概念によって解釈できると考えました。
バーガー氏によると、感染に成功した(感染力が強い)ウイルスは「文法的に正しい」配列であり、感染に失敗したウイルスは「文法的に正しくない」と解釈できます。
さらに、ウイルスの突然変異は「意味の違い」として解釈できるとのこと。
突然変異したウイルスは以前のウイルスとは異なった意味を持っているため、それを読み取る免疫系も勘違いしてしまうというのです。