Hex のゲームのモンテカルロ ツリー検索に基づいて単純な 16 進プレーヤーを開発しました。ここで、RAVE (Rapid Action Value Estimation) と LGP (Last Good Reply) を使用して hex プレーヤーを拡張したいと考えています。記事はこことここにあります。
ツリー検索のパフォーマンスを改善するためにこれらの方法のいずれかを使用し、それを理解するのに役立つ人がここにいるかどうか疑問に思っていましたか?
また、なぜこれらのアルゴリズムが AMAF (All Moves As First) ヒューリスティックと呼ばれているのか知りたいですか?