問題タブ [stochastic-gradient]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - TF2 オプティマイザー クラスをオーバーライドし、勾配の適用に問題がありますか?
元の keras SGD + モメンタム クラスをオーバーライドする独自のオプティマイザー (SGD + モメンタム) を実装しようとしています。事前にトレーニングされた初期化パラメーターとハイパーパラメーター (速度、運動量、学習率) を渡し、それらを SGD + 運動量のハイパーパラメーターとして使用しようとしています。TF2 オプティマイザー クラスを少しいじった後、作成スロットを独自の速度ウェイトでオーバーライドし、それらに運動量定数を掛ければうまくいくはずだと判断しましたが、optim.apply_gradients( )。私が正しい方向に進んでいるかどうかについて何か意見はありますか? 編集したクラスは次のとおりです。
次に、アイリス データ セットを使用して TF2 からの単純なトレーニング ループを初期化して使用すると、エラーがスローされます。
このエラーをスローします:
/usr/local/lib/python3.7/dist-packages/six.py in raise_from(value, from_value)
InvalidArgumentError: var と accum は同じ形状を持っていません [4,10] [10] [Op:ResourceApplyKerasMomentum]
これは、重みを初期化するために使用しているおもちゃの問題です。