これは、最適解が不明な最適化問題として扱うことができます。次に、何らかの形式のメタヒューリスティックアルゴリズム (遺伝的アルゴリズム、PSOなど) を使用して、最適なものが見つかるまで AI にバリエーションを適用できます。興味深いことに、これらのアルゴリズムは必ずしも「最高」を返すとは限りませんが、以前のものよりも優れたものを取得することは依然として有用です。
通常、メタヒューリスティック アルゴリズムには、基本的にソリューションを比較して最適なソリューションを見つけるフィットネス関数が必要です。あなたの場合、勝率をフィットネス関数として使用できます。すでに 418/115 の比率を達成しているので、これを「ベースライン」として使用して、将来のソリューションを比較できます。
残念ながら、私が提案していることはあまりにも大げさであるか (もっと単純なものを探しているかもしれません)、または一般的すぎる可能性があることは理解しています。
残念ながら、それが完璧かどうかを確認するために使用できる統計についてはわかりません. 私がすぐに思いついたアイデアの 1 つは、次のように仮定することです。
あなたの再帰アルゴリズムはすでにこれを返しています。ここで問題は、勝利の量を増やすことは可能ですか? 次に、次の仮定を立てることができます: - 両方のプレイヤーが完全にプレイした場合、結果は常に引き分けになります (猫のゲーム)。
この仮定と前の仮定の評価に基づいて、AI (ボブと呼びましょう) が完璧である場合、ボブ対ボブのゲームでは、結果は常に引き分けでなければならないことを意味します。
これでも勝利数を増やすのに役立たないことは承知していますが(可能であれば)、使用できる別のメトリックを提供します-少なくともボブ対ボブのゲームで、エッジケースが存在しないことを確認します勝者です (これは、AI が完璧ではないことを意味します)。