私は現在、66 や Schnapsen に似た 2 プレーヤーのトリック アンド ドロー カード ゲームの実装に取り組んでいます。基本的には、トリックに勝つことでポイントを集める必要があり、パックにカードがある間、各ラウンドの後に両方のプレイヤーがカードを引きます。
私は、チートを行わず、特定のゲーム ステートでの情報のみを使用して最適な動きを実際に計算する、ゲーム用の優れた AI をプログラミングしている段階です。どのアルゴリズムまたはロジックを使用するのが最適かを判断するのに行き詰まっています。特にゲームの開始時に隠された情報が多すぎるため、Alpha-Beta プルーニングのようなアルゴリズムは使用しないことにしました。モンテカルロ木探索とそれに関連する UCT 探索について興味深い記事をたくさん読みましたが、ゲームには確率的要素があるため、探索する必要のある木は短時間で巨大化してしまいます。
どのアルゴリズムまたはアプローチを使用するのが最適ですか?