問題タブ [encoder-decoder]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - LSTM の使用中に入力に NaN が含まれる
一変量のエンコーダー/デコーダー LSTM モデルを構築しようとしています。このエラーが何度も発生しました:
ValueError: 入力に NaN、無限大、または dtype('float32') には大きすぎる値が含まれています。
同じエラーについて尋ねた他の投稿を既に検索して読んでいますが、データに nan 値がないと確信しています。
LSTM の非表示の計算のために nan 値が生成されました。
エポックごとにループを実行してmodel.fit
、履歴を呼び出して出力しました。
約numEpoch
=610 までは正常に機能し (正確な数を忘れてしまいました)、その後nan
、検証の損失として表示され始めました。
これが私のモデル定義です:
Train_X
形状は (362, 3, 27)
必要に応じて詳細をお知らせします。
python - モデル入力は `tf.keras.Input` から取得する必要があります ...、それらは前の非入力レイヤーの出力であってはなりません
Python 3.7.7 を使用しています。および Tensorflow 2.1.0。
事前にトレーニングされた U-Net ネットワークがあり、そのエンコーダーとデコーダーを取得したいと考えています。
次の図では:
畳み込みエンコーダー/デコーダー アーキテクチャを見ることができます。エンコーダー部分、つまり画像の左側に表示されるレイヤーを取得したい:
そしてデコーダー部分:
この関数から U-Net モデルを取得します。
補助機能は次のとおりです。
このモデルのグラフは次のとおりです。
私はネットワークを訓練し、それを訓練した後、これを行うエンコーダーを取得します:
そして、それは完璧に機能します。
しかし、デコーダーを抽出しようとすると、次のようになります。
理解できない次のエラーが表示されます。
TraceBack、そして別のエラー:
デコーダーを取得するためにこのコードを試しました:
しかし、ほとんど同じエラーが発生します。
事前学習済みの U-Net ネットワークからデコーダーを取得するにはどうすればよいですか?
deep-learning - 出力が浮動小数点数の配列である場合の pytorch の適切な損失関数
https://pytorch.org/tutorials/intermediate/seq2seq_translation_tutorial.htmlに非常によく似たエンコーダー/デコーダー モデルを作成しています。
唯一の違いは、ここでは単語がいくつかのインデックスで表されていることです。単数で表される別のメトリックに基づいてそれらを表示したいと思います。
損失関数nn.criterion = nn.NLLLoss() は、クラスでのみ作業しているときに機能しているようです。
出力配列が整数の配列ではなく、浮動小数点数の配列である場合、どのような種類の損失関数を使用できますか? 他のすべての部分はチュートリアルに似ていると考えていますか?
前もって感謝します。