問題タブ [dqn]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
124 参照

python - dqn 状態値は 0 から 1 のみである必要があります

DQN の状態の値が 0 から 1 のみである必要がある場合、たとえば state = [0, 0, 0, 1, 1, 1, 1, 0, 1, 0]

または、1 より大きい値を持つ状態を持つことができます eh state = [6, 5, 4, 1, 1, 1, 2, 3, 15, 10]

0 投票する
1 に答える
202 参照

reinforcement-learning - 累積報酬に対する学習率の減衰?

深層強化学習では、累積報酬に対して学習率を減衰させる方法はありますか? つまり、エージェントが学習して報酬を最大化できる場合、学習率は低下しますか?