tf.keras で SGD オプティマイザを使用したい。しかし、SGDの詳細は言った
勾配降下 (運動量あり) オプティマイザー。
SGD が「データセットフェーズで例をランダムにシャッフルする」をサポートしていないということですか?
SGDソースを確認したところ、ランダムシャッフル方式はないようです。SGD についての私の理解は、ランダム サンプルに勾配降下法を適用することです。
ただし、Momentum と Nesterov を使用した勾配降下のみを行います。
コードで定義したバッチサイズは、SGD ランダム シャッフル フェーズを表していますか?
もしそうなら、ランダムにシャッフルしますが、同じデータセットを使用することはありませんね?
私の理解は正しいですか?
以下のようにバッチに関するコードを書きました。
(x_train, y_train)).shuffle(10000).batch(32)
test_ds = tf.data.Dataset.from_tensor_slices((x_test, y_test)).batch(32)