問題タブ [semantic-segmentation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Sagemaker セマンティック セグメンテーション: クラスごとの iou およびピクセル精度
AWS sagemaker でセマンティックセグメンテーション作業を行っています。私の出力は、すべてのクラスの平均 IOU とピクセル精度ですが、より細分性が必要なため、各クラスの IOU とピクセル精度が必要です。これは、どのクラスを改善する必要があるかを確認するためのものです。
可能だと思いますが、どうですか?
これらの同様の質問を見てきましたが、まだ解決策はありません。
python - flow_from_directory() を使用した keras (TensforFlow バックエンド) によるセマンティック イメージ セグメンテーション (3 ラベル) の入力パイプライン
私は keras (TensorFlow バックエンド) を使用しており、flow_from_directory を使用して画像セグメンテーション (3 ラベル) 用のラベル/マスクを取り込む方法を理解しようとしています。
train_images の寸法は (144、144、144) - グレースケール、uint8 です。対応する label_images のサイズは同じですが、値 1 はラベル 1、値 2 = ラベル 2、値 3 = ラベル 3 を表し、値 0 はラベルのないピクセルを示します。
これはセマンティック セグメンテーションであるため、画像内の各ピクセルを分類するには、ピクセル単位のクロス エントロピー損失関数を使用する必要があります。また、いくつかの投稿で読んだように、keras (または TensorFlow) では、label_image/mask がホット コーディングされている必要があります。したがって、私の label_images は、各ピクセルがバイナリ ベクトルで構成される 3 つのチャネルを持つ画像であると期待しています。例: [0, 1, 0]。
0 として保存されているラベルのないピクセルを処理するにはどうすればよいですか? [0, 0, 0] としてエンコードする必要がありますか?
しかし、答えが見つからない場合の質問は次のとおりです。label_images を正しく再形成/ワンホット エンコードするにはどうすればよいですか? image_labels を変換できる keras の便利な関数はありますか?