入力画像とニューラル ネットワークを指定すると、画像内の各ピクセル (空、草、山、人、車など) のラベル付きクラスを出力する方法を探しています。
私は Caffe (将来のブランチ) をセットアップし、PASCAL-Contextモデルで FCN-32s Fully Convolutional Semantic Segmentation を正常に実行しました。ただし、明確なラベル付き画像を作成することはできません。
私の問題を視覚化する画像:
入力画像
のグラウンド トゥルース
と私の結果:
これは、解像度の問題である可能性があります。どこが間違っているのか分かりますか?