問題タブ [deconvolution]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tensorflow - tf.transpose の代替品?
ネットワーク内のレイヤーの性質上、3 つの転置を行う必要があります。
これには膨大な時間がかかります
batch_size が 10 の場合。
サイズが似ていて、転置がなく、同じデータセット上の以前のモデルは、最初のバッチで 10 秒、その後はバッチごとに 0.4 秒かかりました。最初のバッチの後、上記のモデルはまだバッチごとに 4 秒以上かかります。
自分がやっている移調に絞り込むことができたと思います。これを回避する方法はありますか?
python - GAN ジェネレーターが望ましい結果を生成しない
私はテンソルフローに少し慣れていないので、問題が明らかな場合はご容赦ください。基本的に、私は敵対的生成ネットワークを作成しており、ジェネレーターは非常に反復的なタイルのようなパターンを生成します。現時点では、私の発電機モデルは次のようになっています
高密度ブロックは次のもので構成されます。
deconv ブロックは次のようになります。
重みとバイアスの作成は次のとおりです。
損失関数とオプティマイザは次のとおりです。
で定義されているように、グラフ「G」のすべてのパラメーターをトレーニングしています。
これは正しい数の変数を返すようです。ネットワークには、サイズ (batch_size、100) のテンソルが供給されます。これは、拡大された mnist データ (64x64 に拡大) に似ているはずです。エラーから気付いたのは、ジェネレーターは、いくつかのエポックとフラットラインの損失に関してのみ改善されるということです。ディスクリミネーターが 50 エポックごとにしか更新されない場合でも、ジェネレーターは約 150 エポック後に改善されません。
出力例は次のようになります: Epoch 500
また、弁別器が正しく機能することにも注意してください。mnist の分類 CNN であるディスクリミネータから始めて、GAN で使用するために、基本的にすべての出力を 1 つのノードにマージしました。
他の出力も同様のタイリング パターンに従いますが、その理由はわかりません。誰かがそれを助けることができれば、それは素晴らしいことです! さらに情報が必要な場合は、お知らせください。