“semantic-segmentation”の関連問題_Stack Overflow日本語サイト

0 投票する

2 に答える

5991 参照

computer-vision - Caffe は画像のピクセルを直接分類できますか?

画像のピクセルを「通り」または「通りではない」に分類したいと思います。KITTI データセットからのトレーニングデータがいくつかあり、Caffe にIMAGE_DATAレイヤータイプがあることがわかりました。ラベルは、入力画像と同じサイズの画像の形式で存在します。

Caffe の他に、この問題を解決するための私の最初のアイデアは、分類する必要があるピクセルの周囲に画像パッチを与えることでした (たとえば、上/左/右/下に 20 ピクセル、分類したいピクセルごとに 41×41=1681 の機能が得られます)。ただし、
これらの画像パッチを手動で作成せずにラベルを使用する方法を caffe に伝えることができれば (レイヤーの種類IMAGE_DATAはそれが可能であることを示唆しているようです)、私はそれを好みます。

Caffe は画像のピクセルを直接分類できますか? このような prototxt ネットワーク定義はどのようになりますか? ラベルに関する情報を Caffe に提供するにはどうすればよいですか?

入力層は次のようになると思います

ただし、crop_size正確な意味はわかりません。本当に中心ですか？caffe は角のピクセルをどのように処理しますか? new_heightとは何new_widthですか？

2015-05-12T18:36:33.810

0 投票する

3 に答える

50936 参照

image-processing - 「セグメンテーション」および「シーンのラベル付け」と比較した「セマンティックセグメンテーション」とは何ですか?

セマンティックセグメンテーションは単なる Pleonasm ですか、それとも「セマンティックセグメンテーション」と「セグメンテーション」に違いはありますか? 「シーンのラベル付け」または「シーンの解析」に違いはありますか?

ピクセルレベルのセグメンテーションとピクセルごとのセグメンテーションの違いは何ですか?

(補足質問: この種のピクセル単位の注釈がある場合、オブジェクト検出は無料で利用できますか?それとも何かすることはありますか?)

定義のソースを示してください。

「セマンティックセグメンテーション」を使用するソース

Jonathan Long、Evan Shelhamer、Trevor Darrell:セマンティックセグメンテーションのための完全な畳み込みネットワーク。CVPR、2015年およびPAMI、2016年
Hong、Seunghoon、Hyeonwoo Noh、および Bohyung Han: 「半教師付きセマンティックセグメンテーションのための分離されたディープニューラルネットワーク」。arXivプレプリント arXiv:1506.04924 , 2015.
V. Lempitsky、A. Vedaldi、および A. Zisserman: セマンティックセグメンテーションのパイロンモデル。神経情報処理システムの進歩、2011年。

「シーンのラベル付け」を使用するソース

Clement Farabet、Camille Couprie、Laurent Najman、Yann LeCun:シーンラベル付けの階層機能の学習。パターン分析とマシンインテリジェンス、2013 年。

「ピクセルレベル」を使用するソース

Pinheiro、Pedro O.、および Ronan Collobert: 「畳み込みネットワークを使用した画像レベルからピクセルレベルのラベル付けまで」。コンピュータービジョンとパターン認識に関する IEEE 会議の議事録、2015 年。 ( http://arxiv.org/abs/1411.6228を参照)

「ピクセル単位」を使用するソース

Li、Hongsheng、Rui Zhao、および Xiaogang Wang: 「ピクセル単位の分類のための畳み込みニューラルネットワークの非常に効率的な前方および後方伝搬」。arXiv プレプリント arXiv:1412.4526 , 2014.

Google Ngram

最近は「シーンラベリング」よりも「セマンティックセグメンテーション」の方がよく使われているようです

image-processing computer-vision object-detection image-segmentation semantic-segmentation

2015-11-26T22:25:37.260

0 投票する

1 に答える

137 参照

tensorflow - セマンティックセグメンテーションのための完全な畳み込みニューラルネットワーク

素朴な質問かもしれませんが、このような質問をするのに適切なチャネルでない場合は申し訳ありません。セマンティックセグメンテーション用の FCNN の実装に成功しましたが、デコンボリューションやアンプーリングレイヤーは使用していません。

私が単純に行っているのは、最終的な FCNN レイヤーのサイズに合わせてグラウンドトゥルースイメージのサイズを変更し、損失を計算することです。このようにして、出力として小さい画像を取得しますが、正しくセグメント化されています。

デコンボリューションまたはアンプーリングのプロセスはまったく必要ですか?

つまり、Python で画像のサイズを変更するのはとても簡単です。確かに私は何かが恋しいです。

unpooling と deconv を使用して画像を拡大する利点は何ですか?

tensorflow machine-learning pooling deconvolution semantic-segmentation

2018-01-26T08:10:52.643

0 投票する

0 に答える

36 参照

deep-learning - Semantic Sermentation、仮面について？

7 x 7 のフィーチャーマップなどのフィーチャーマップでマスクを取得した場合、これらの 7 x 7 のマスクが最終的に生の画像のマスクになるにはどうすればよいですか? 補間またはアップサンプリングを使用していますか? 私に関する限り、49 ピクセルしかない 7 x 7 の特徴マップでマスクを行う場合、49 ピクセルのみで特定しすぎることはできないため、生の画像でオブジェクトをマスクするには粗すぎますか? ...

どうもありがとう！！

deep-learning image-segmentation semantic-segmentation

2018-01-27T08:33:30.700

0 投票する

1 に答える

378 参照

python-3.x - Pascal VOC pickle データセットの Pickle を読み込めません

スタンフォードのウェブサイトhereから Pascal VOC データセットを読み込もうとしています。また、Pascal VOC Pystruct blog でセマンティックイメージセグメンテーションのコードを実装しようとしています。しかし、ピクルファイルを読み込もうとすると UnicodeDecodeError が発生します。これまでのところ、以下のコードを試しました：

そして、私はこのエラーを受け取りました:

同じ問題と解決策が見つかりませんでした。これを機能させるにはどうすればよいですか？

python-3.x numpy pickle semantic-segmentation

2018-02-19T08:34:55.643

問題タブ [semantic-segmentation]

computer-vision - Caffe は画像のピクセルを直接分類できますか?

image-processing - 「セグメンテーション」および「シーンのラベル付け」と比較した「セマンティック セグメンテーション」とは何ですか?

「セマンティック セグメンテーション」を使用するソース

「シーンのラベル付け」を使用するソース

「ピクセルレベル」を使用するソース

「ピクセル単位」を使用するソース

Google Ngram

tensorflow - セマンティック セグメンテーションのための完全な畳み込みニューラル ネットワーク

deep-learning - Semantic Sermentation、仮面について？

python-3.x - Pascal VOC pickle データセットの Pickle を読み込めません

Reference

image-processing - 「セグメンテーション」および「シーンのラベル付け」と比較した「セマンティックセグメンテーション」とは何ですか?

「セマンティックセグメンテーション」を使用するソース

tensorflow - セマンティックセグメンテーションのための完全な畳み込みニューラルネットワーク