【AI】チェスや囲碁で有効だったAIの強化学習が単純なゲームで失敗してしまう理由とは？

2026/03/31 05:04

1: すらいむ ★ 2026/03/19(木) 22:27:07.24 ID:CVtX96Yh

チェスや囲碁で有効だったAIの強化学習が単純なゲームで失敗してしまう理由とは？　AIはチェスや囲碁といったボードゲームで人間を上回る強さを発揮していますが、2023年には特定の戦術を用いることで囲碁AIに勝利する方法が見つかるなど、AIの強さには弱点もあることがわかっています。　新たに発表された論文では、AlphaZeroなどで採用されている強化学習という機械学習手法が、一部のシンプルなゲームでは通用しないことが報告されました。　Impartial Games: A Challenge for Reinforcement Learning | Machine Learning | Springer Nature Link　https://link.springer.com/article/10.1007/s10994-026-06996-1　（以下略、続きはソースでご確認ください）

2: 名無しのひみつ 2026/03/20(金) 03:02:35.11 ID:yup0ttYY

こんなゲームがあったんだ、知らなかった！

3: 名無しのひみつ 2026/03/20(金) 14:05:03.88 ID:DONlDAeK

検索するとニムは明確な必勝法があって少ない計算量で状況を把握できるみたい　>必勝法（数学的アプローチ）　>ニムの必勝法は、各山の石の数を2進数に変換し、すべての山の石の数のXOR（排他的論理和）を計算することで求められます。　>XOR和が0以外: 先手が必勝。相手の石を減らし、XOR和を0にするように石を取る。　>XOR和が0: 後手が必勝。先手がどう動いても、次の自分のターンでXOR和を0に戻す。　>最終的にXOR和を0に保ち続け、最後の石を取る状況（XOR和が0で、自分の石だけが残る状態）を作る。　Alphaシリーズは木探索は得意だけど必勝への法則性を見つけるのは苦手ってことなのだろうか

続きはアプリで無料で読めます

アプリで続きを読む