CloudML で MNIST の分散バージョンを使用していますが、トレーニング フェーズ中に表示されるログを理解できません。
INFO:root:Train [master/0], step 1693: Loss: 1.176, Accuracy: 0.464 (760.724 sec) 4.2 global steps/s, 4.2 local steps/s
INFO:root:Train [master/0], step 1696: Loss: 1.175, Accuracy: 0.464 (761.420 sec) 4.3 global steps/s, 4.3 local steps/s
INFO:root:Eval, step 1696: Loss: 0.990, Accuracy: 0.537
INFO:root:Train [master/0], step 1701: Loss: 1.175, Accuracy: 0.465 (766.337 sec) 1.0 global steps/s, 1.0 local steps/s
一度に 200 以上のサンプルをランダムにバッチ処理しています。
通常は反対であるのに、Train acc/loss と Eval acc/loss の間にこのようなギャップがあるのはなぜですか?
また、グローバルステップとローカルステップの違いは何ですか?
私が話しているコードはhereです。task.py は、グラフが作成されるファイルである model.py を呼び出しています。