0

収束していないトレーニング損失の問題が発生しています。(バッチサイズ: 16、平均損失: 10)。私は次の方法を試しました+学習率lrを変化させます(初期lr = 0.002はe + 10前後の非常に高い損失を引き起こします)。次に、lr = e-6 では、損失は小さいように見えますが、収束しません。+ バイアスの初期化を追加 + バイアスと重みの正則化を追加

これはネットワーク構造トレーニング ロス ログです。

ご連絡をお待ちしております

4

0 に答える 0