問題タブ [mlp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - タイム ステップが 1 つの LSTM のパフォーマンスが MLP より優れているのはなぜですか?
好奇心から、スタック LSTM ニューラル ネットワークと tanh 活性化関数を使用した MLP を単一のタイム ステップと比較して、同じパフォーマンスになると考えました。比較に使用されたアーキテクチャは次のとおりで、回帰問題の同一のデータセットでトレーニングされています (損失関数は MSE)。
驚くべきことに、LSTM モデルの損失は MLP よりもはるかに速く減少します。
100 エポック後、MLP の検証損失は約 1e-4 に減少しましたが、LSTM の損失は約 1e-5 に減少しました。LSTM セルは以前のタイムステップのメモリを使用していないため、これら 2 つのアーキテクチャがどのように異なるかについては、あまり意味がありません。また、MLP のトレーニングは LSTM の約 3 倍高速です。誰かがその背後にある数学を説明できますか?
tensorflow - GridsearchCVを介してKerasでMLPモデルのハイパーパラメータ調整を実行するには?
関数を使用してモデルを作成し、1D 配列の形式でモデルへの入力として 2 つの埋め込みを渡しています。入力にグリッド検索を適合させようとすると、「サンプル数が一致しない入力変数が見つかりました」というエラーがスローされます。入力は 1D であるため、入力の形状を変更しようとしましたが、無駄でした。
問題は、複数の入力と単一の出力を持つ keras MLP モデルのハイパーパラメータ調整を行う方法です。
もう 1 つの質問は、モデルの概要を取得する方法です。model.summary() を使用してみましたが、関数で作成したモデルでは機能しません。
tensorflow - tensorflow と keras を使用して Python で MLP コードを CNN に置き換える
以下のコードを MLP で試してみました。この MLP コードを次の構造の CNN 8 層に置き換える必要があります: 3×3×32 Convolutional → 3×3×64 Convolutional → 2×2 MaxPool → Dropout → Flatten → 1 × 128全結合→ドロップアウト→128×10 全結合→ソフトマックス。
フォローしてみた
それが正しいか?