問題タブ [mini-batch]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 深層学習におけるミニバッチによる損失関数
私の理解が正しければ、ミニバッチで深層学習を使用する場合、すべてのミニバッチに (対応するオプティマイザーを使用して) 前方パスと後方パスがあります。しかし、エポックの終わり (すべてのミニバッチを使用した後) に何か違うことが起こりますか?
私が質問している理由は、画像セグメンテーション用の u-net の実装で、すべてのミニ バッチで損失がわずかに (0.01 のオーダーで) 減少することがわかるからです。次に、新しいエポックが始まると、前のエポックの最後のミニ バッチに対する最初のミニ バッチの損失が大きく変化します (0.5 のオーダー)。また、最初のエポックの後、テスト データの損失は、次のエポックの最初のミニ バッチの損失の順序になります。
これは、異なるミニバッチよりもエポックの終わりに重みが速く更新されるかのように解釈しますが、これをサポートする理論は見つかりませんでした。説明をいただければ幸いです。
オプティマイザに関しては、これは確率的勾配降下法と Adam の両方で発生しています。それが役立つ場合、私は Keras を使用しています。
tensorflow - ミニバッチを Tensorflow 入力プレースホルダーにフィードできない - Tensorflow 1.3.0
データのミニバッチを入力にフィードできない理由を誰か教えてもらえますtf.nn.placeholder
か? 昨年ずっと私のために働いていたので、最近何かが変わりましたか?
エラー:
Cannot feed value of shape (1024, 784) for Tensor 'nn_inputs:0', which has shape '(?, 768)'
そして、私の入力tf.nn.placeholder
は次のとおりです。