問題タブ [dqn]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
208 参照

python - 月着陸船問題のDQN訓練、学習不能。収束しない

こんにちは、Lunar Lander の離散問題を解決するために DQN エージェントをトレーニングしようとしていますが、学習できません。平均報酬は、1000 エピソード後でも -130 前後で推移しています。ターゲットネットワークも使用しました。私が間違っていることを教えてください..以下の私のコード。(そして、コードはcolabとkaggleの両方でgpuで実行されていません。そのため、変更の効果を確認するのに時間がかかりすぎています..)助けてください。