MCTS に関して基本的な質問があります。私の質問は、開始状態の処理に関するものです。私が理解している限り、検索ツリーは有効なアクションの分岐によって構築され、その結果、毎回同じ状態で開始するときに同じ検索ツリーが走査されます。しかし、ゲームが始まるたびにゲームの開始状態が異なる場合はどうなるでしょうか。(たとえば、異なるカードが配られた) その結果、複数のルート ノードが本質的に、配られたカードの N 個の可能な組み合わせを持つゲームの N 個の異なる検索ツリーになりますか? これは、以前のゲームで作成した検索ツリーが、開始状態が異なると役に立たないということではないですか? MCTS では、さまざまな開始状態がどのように処理されますか?
前もって感謝します。