わかりました。基本的には、MCTS がノード選択などでどのように機能するかを理解しています。理解していないのは、ランダムなロールアウト フェーズです。勝敗が決まるまで、将来のゲームのステップをランダムにシミュレートしているというのは正しいですか? 多くの状態と可能なアクション、未知の敵の動きを伴うより複雑なゲームでは、ロールアウトに非常に時間がかかりませんか? ゲームの終わりに到達するまで敵の動きをランダムにロールアウトする場合、勝敗をランダムに返すだけで十分ではありませんか? ロールアウト フェーズについて、3 ステップ ゲームまたは 4 ステップ ゲームのような簡単な例で説明していただけると幸いです。
前もって感謝します。