問題タブ [semantic-segmentation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 私の画像セグメンテーション結果マップには、白いパッチに黒い格子が含まれています
Pytorch 0.4.0 による UNet のような CNN アーキテクチャを使用して画像セグメンテーションを行っています。最終的なセグメンテーション結果では、フォアグラウンドを 1、バックグラウンドを 0 としてマークします。事前にトレーニングされた VGG の特徴抽出器をエンコーダとして使用するため、エンコーダー出力を何度もアップサンプリングします。
kernel_size=3、stride=2、padding=1、output_padding=1
(output_padding は、たとえば、入力サイズが 40*30 のスキップ接続機能のサイズに合わせて使用されます。式:out=s(in-1) を使用した計算の下で、1 つのデコンボリューション レイヤーでサイズを 2 回拡大します。 +k-2p, サイズを維持するためにパディング 1 と出力パディング 1 を使用する必要があります。黒い格子を生成する理由が気になります.それらは格子状または正方形の部分のように見えます.そしてそれを解決する方法.さらに、すべての deconv レイヤーのハイパーパラメータを 1 つの均一に調整するか、個別に変更する必要がありますか?
環境:Ubuntu 16.04、Pytorch 0.4.0、GTX 1080Ti、アップサンプリングのアーキテクチャは3つのdeconvレイヤーで、次々と。
アップデート
deconv ハイパーパラメータを変更した後 (画像セグメンテーション結果のノイズに触発されて使用)
kernel_size=4、ストライド=2、パディング=1
黒い点が散らばっているように見えます.これらの黒い点はその部分を変えて別の部分にジャンプしているようです.なぜそれが起こるのかわかりません.ネットワークのハイパーパラメータを変更する方法がわかりません.caffe - チェックに失敗しました: top_shape[j] == bottom[i]->shape(j): 3D データの Concat レイヤー用
で3D-Unetをトレーニングしようとしていcaffeます。異なるボリュームの幅、高さ、深さは異なります。HDF5 データセットの最初のボリュームの入力形状は1 1 104 281 389(NxCxDxHxW) で、Concat layer(concat_d2c_u2a-b) に達するとエラーが発生します。入力は次の 2 つの形状です。
- 1 256 19 64 91 scaled2c_relu_d2c_0_split_1
- 1 512 12 56 84 スケールu2a
この問題を解決するにはどうすればよいですか? 次元の順番のせいですか?

