6

この場合、入力の 1 つはアーム/アクションを選択する確率ですが、その確率をどのように見つけるのでしょうか? その可能性を見つけること自体が大きな課題ではないでしょうか。

4

1 に答える 1