チェスや将棋でAIが当たり前のように勝利する時代になりましたが、ルールだけは人間に教えてもらわなければいけません。
しかし、イギリスの人工知能企業「DeepMind」は、ルールを一切教えなくても自力で理解して、従来と同等かそれ以上戦えるAIを作成したと発表。
AIアルゴリズムの詳細は、12月23日付けの科学誌『nature』に掲載されています。
目次
AIの課題は「ルールを見つける」こと
新しいAI「MuZero」は必要な情報だけをモデル化する
AIの課題は「ルールを見つける」こと
圧倒的な学習能力と計算能力を有するAIでも、人間の知性には遠く及びません。
実際、チェスや囲碁、将棋などで人間に勝利するAIでさえ、前提つまりルールは人間が教えてあげなければいけません。
つまり人間のように、「ルールブックを読まなくても、なんとなくルールを把握していく」ことはできないのです。
そしてこの問題はゲームAIだけでなく、すべてのAIが次の段階に進むための大きな課題でもあります。
仮にAIが「環境や状態から特定のルールを見つけ出して、最善の決定ができる」のであれば、人間以上の学習能力と計算能力を生かして、ある意味人間を超えることができるでしょう。
では、AIは「ルールを発見する」という課題を達成できるのでしょうか?
答えはYesです。
なぜなら人工知能企業DeepMindが、一切ルールを教えなくてもチェスや将棋、また「パックマン」のようなクラシックビデオゲームで戦って勝利できるAI「MuZero」を開発したからです。
新しいAI「MuZero」は必要な情報だけをモデル化する
では、ルールを教えられていないMuZeroはどのようにルールを覚え、戦えるようになっていくのでしょうか?
大切なのはモデル化する情報を限定することです。
例えば、何も知らない幼児も、経験から「どうすれば雨に濡れないか」という点を自ら学びます。
もちろん、幼児たちは「降水確率の高い空気中の成分パターンすべて」を把握しているのではありません。
単純に「傘をいつも持っていて、雨が降ったときに傘をさせばよい」というシンプルな点を学んでいるだけです。
幼児の周囲には気候や道具などの膨大な環境情報が溢れていますが、目的に関係のあるシンプルな情報だけをモデル化しているのです。
同じようにMuZeroも、重要な意思決定プロセスだけをモデル化することで、ルールを素早く把握できるようプログラムされています。
続く部分でMuZeroがモデル化する環境要素と、MuZeroの実力について紹介しましょう!