問題タブ [dqn]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

147 問題

0 投票する

1 に答える

124 参照

python - dqn 状態値は 0 から 1 のみである必要があります

DQN の状態の値が 0 から 1 のみである必要がある場合、たとえば state = [0, 0, 0, 1, 1, 1, 1, 0, 1, 0]

または、1 より大きい値を持つ状態を持つことができます eh state = [6, 5, 4, 1, 1, 1, 2, 3, 15, 10]

2020-05-25T11:57:45.377

0 投票する

1 に答える

202 参照

reinforcement-learning - 累積報酬に対する学習率の減衰？

深層強化学習では、累積報酬に対して学習率を減衰させる方法はありますか? つまり、エージェントが学習して報酬を最大化できる場合、学習率は低下しますか?

reinforcement-learning dqn

2020-06-17T20:32:25.517

1 2 3 4 5 6 7 8 9 10

問題タブ [dqn]

python - dqn 状態値は 0 から 1 のみである必要があります

reinforcement-learning - 累積報酬に対する学習率の減衰？

Reference