問題タブ [encoder-decoder]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tensorflow - 複数の畳み込み層を追加すると、エンコーダー/デコーダー モデルの精度が低下します
私は TensorFlow での SegNet の実装に取り組んでおり、航空画像を「建物」と「建物ではない」の 2 つのクラスに分割するために使用しています。ネットワークの小さいバージョンを使用しており、最大 82% mIoU の精度が得られます。
ただし、元の SegNet のように複数の畳み込み層を追加してネットワークを拡張したかったのですが、機能させることができません。
これは、機能する小さなモデルをどのように実装したかです。
これは拡張モデルで、非常に悪い結果が得られます。
畳み込み層:
画像内のすべてのピクセルが「構築していない」クラスに分類されるため、拡張モデルは約 10% の mIoU を取得します。なぜこれが起こっているのかを理解するのを手伝ってくれる人はいますか? SegNet のcaffe 実装を見てきましたが、2 つの実装の違いがわかりません。