artificial-intelligence - モンテカルロシミュレーションにおける "Last Good Reply" と "Rapid Action Value Estimation" の概念は何ですか?

翻译自：https://stackoverflow.com/questions/39796969 2016-09-30T17:30:43.863

422 次

Hex のゲームのモンテカルロツリー検索に基づいて単純な 16 進プレーヤーを開発しました。ここで、RAVE (Rapid Action Value Estimation) と LGP (Last Good Reply) を使用して hex プレーヤーを拡張したいと考えています。記事はこことここにあります。
ツリー検索のパフォーマンスを改善するためにこれらの方法のいずれかを使用し、それを理解するのに役立つ人がここにいるかどうか疑問に思っていましたか?
また、なぜこれらのアルゴリズムが AMAF (All Moves As First) ヒューリスティックと呼ばれているのか知りたいですか?

artificial-intelligence - モンテカルロ シミュレーションにおける "Last Good Reply" と "Rapid Action Value Estimation" の概念は何ですか?

1 に答える 1

Related

Reference

artificial-intelligence - モンテカルロシミュレーションにおける "Last Good Reply" と "Rapid Action Value Estimation" の概念は何ですか?