0

ddpg のように、(s, a, r, s_next) を保存します。s_next の予測結果を s に入れることができますか? MDPに違反していますか

4

0 に答える 0