3x4 (行 x 列) グリッドでの 3 行ゲームの negamax-algorithm に苦労しています。これは、よく知られている 4-in-a-row のようにプレイされます。つまり、ピースがドロップされます (TicTacToe とは異なります)。プレイヤーを R と B としましょう。R が最初の移動を行い、B の移動はネガマックスによって制御されます。可能な手は 1、2、3、または 4 です。これは、R: 手 3 --> B: 手 1 --> R: 手 3 の後に到達した問題の位置です。
1 2 3 4
| | | | | | | | |
| | | | | | R | | |
| | ビ | | | R | | |
ここで、R によって手 3 を防御するために、B は手 3 自体をプレイする必要がありますが、B はそうすることを拒否します。代わりに手 1 をプレイし、R の次の手でゲームは終了します。
ちなみに、3x3グリッドで完全に機能するネガマックス実装のエラーを探すのに丸一日費やしましたが、何も見つかりませんでした。
それから私は考え始めました: ネガマックス アルゴリズムの動作の別の説明は、R が 3x4 グリッドで手番 3 でゲームを開始した後、B がすべてのバリエーションで失われるということです。
誰かがこの命題に反論したり、私に証明を指摘したりできますか?
ありがとう、RSel