問題タブ [stochastic-gradient]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
neural-network - Pytorchを使用してMNISTデータセットでSGDを使用すると、損失が減少しません
バッチサイズ 32 の MNIST データセットで SGD を使用しようとしましたが、損失はまったく減少しません。モデル、損失関数を確認し、ドキュメントを読みましたが、何が間違っていたのかわかりませんでした。
ニューラルネットワークを次のように定義しました
そして、トレーニングプロセスを以下のように定義しました
LogSoftmax 層のモデルを使用しているため、損失関数は正しいようです。しかし、損失はまったく減少しません。