私は三目並べAIを作成しました。各ボードの状態を考えると、私のAIは移動する正確な場所を1つ返します。(動きが同じように正しい場合でも、毎回同じものを選択し、ランダムなものを選択することはありません)
また、AIで可能なすべてのプレイをループする関数を作成しました
つまり、これはAIが特定のボードに対して移動できるようにする再帰関数であり、次に他のプレイがすべての可能な移動を実行できるようにし、可能な移動ごとに新しいボードを使用して再帰関数を呼び出します。
これは、AIが最初に行われるときと、もう一方が最初に行われるときに行います...そしてこれらを足し合わせます。最終的には、勝ちは418回、引き分けは115回、負けは0回になります。
しかし今、私の問題は、どうすれば勝利の量を最大化できるかということです。この統計を何かと比較する必要がありますが、何と比較すればよいかわかりません。