問題タブ [semantic-segmentation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
418 参照

python - 私の画像セグメンテーション結果マップには、白いパッチに黒い格子が含まれています

ここに画像の説明を入力Pytorch 0.4.0 による UNet のような CNN アーキテクチャを使用して画像セグメンテーションを行っています。最終的なセグメンテーション結果では、フォアグラウンドを 1、バックグラウンドを 0 としてマークします。事前にトレーニングされた VGG の特徴抽出器をエンコーダとして使用するため、エンコーダー出力を何度もアップサンプリングします。

これらの異なる形状の黒い部分は、デコンボリューション レイヤーが原因であると思われます。デコンボリューション レイヤーは、公式ドキュメントの入力ピクセル間に (s-1) ゼロを追加すると言われています。デコンボリューション レイヤーのハイパーパラメーターを以下に示します。

kernel_size=3、stride=2、padding=1、output_padding=1

(output_padding は、たとえば、入力サイズが 40*30 のスキップ接続機能のサイズに合わせて使用​​されます。式:out=s(in-1) を使用した計算の下で、1 つのデコンボリューション レイヤーでサイズを 2 回拡大します。 +k-2p, サイズを維持するためにパディング 1 と出力パディング 1 を使用する必要があります。

黒い格子を生成する理由が気になります.それらは格子状または正方形の部分のように見えます.そしてそれを解決する方法.さらに、すべての deconv レイヤーのハイパーパラメータを 1 つの均一に調整するか、個別に変更する必要がありますか?

環境:Ubuntu 16.04、Pytorch 0.4.0、GTX 1080Ti、アップサンプリングのアーキテクチャは3つのdeconvレイヤーで、次々と。

アップデート

deconv ハイパーパラメータを変更した後 (画像セグメンテーション結果のノイズに触発されて使用)

kernel_size=4、ストライド=2、パディング=1

したがって、出力パディングを回避し、サイズを満たすために.しかし、100エポックの後、私は同様の問題に遭遇しました.

さらに 30 エポックのトレーニングを行うと、次のようになります。ここに画像の説明を入力

黒い点が散らばっているように見えます.これらの黒い点はその部分を変えて別の部分にジャンプしているようです.なぜそれが起こるのかわかりません.ネットワークのハイパーパラメータを変更する方法がわかりません.
0 投票する
1 に答える
511 参照

caffe - チェックに失敗しました: top_shape[j] == bottom[i]->shape(j): 3D データの Concat レイヤー用

で3D-Unetをトレーニングしようとしていcaffeます。異なるボリュームの幅、高さ、深さは異なります。HDF5 データセットの最初のボリュームの入力形状は1 1 104 281 389(NxCxDxHxW) で、Concat layer(concat_d2c_u2a-b) に達するとエラーが発生します。入力は次の 2 つの形状です。

  • 1 256 19 64 91 scaled2c_relu_d2c_0_split_1
  • 1 512 12 56 84 スケールu2a

この問題を解決するにはどうすればよいですか? 次元の順番のせいですか?