③チェスエンジン自体(Stockfish)の動作ファイルを上書きするものです。
これは、対戦相手の計算能力を封じ、実力を発揮できなくする行為に相当します。
のように、姑息なものから破壊的なものまでさまざまでした。
ただ、成功率はあまり高くなく、o1-previewは全体の46%が「フェアプレイ」(正攻法)で、54%が「予期しない行動」(ハッキングなど、仕様の抜け道を使った行動)を行いましたが、ハッキングをした場合の成功率は6%だけでした。
また、DeepSeek R1も、o1-previewと同様に対戦中にチェスエンジンStockfishが強すぎると判断すると、11%の試行で不正に動こうとしましたが、実行環境(API)の不安定さもあって成功率は0%でした。
一方、GPT-4oやClaude 3.5 Sonnetなどは、研究者が明示的に「ズルをしてみろ」と促さない限り、基本的に正規のプレイに徹していたといいます。
(※加えて、OpenAI社の最新モデルであるo1やo3-miniでも不正行為は見られませんでした。)
現実で同じことが起こるとどうなるか?

一見「チェスのチート」など軽い話題にも思えますが、研究者たちは次のような懸念を示しています。
最も懸念されるのが、リアル世界で同じような不正が行われる可能性です。
AIがアプリやWebサイトで予約や購入などの代行をする際、「店が満席だったら裏のシステムに入り込んで別のお客を追い出してしまう」など、人間が想定していない不正操作をするリスクがあります。
また、AIがプログラミングやサイバーセキュリティの分野でも急激に進歩しており、「人間以上に頭が回るAI」が“悪用”に手を染めた場合、人間の制御をすり抜ける戦略を編み出す可能性があります。
さらに、厄介なことに、AIの不正を止めることは技術的にかなり困難です。