image-processing - 分類のための言葉の袋 - 特徴とピクセル

Question

bag-of-words モデルを使用して医用画像を分類しています。特徴ベクトルを抽出するために次のことを行いました。

小さな画像パッチから特徴を抽出し、それらの特徴に BOW を適用します
小さな画像パッチからピクセル値を抽出し、それらのピクセル値に BOW を適用します

特徴抽出の後、精度を向上させるために、PCA、特徴選択、KMeans のクラスター数の変更などを試しました。しかし、私の場合、ピクセル値 (1) で学習した BOW は、機能 (2) で学習した BOW (70%) よりも優れています (90%)。私の機能は優れており、これらの機能を使用して他のフレームワークを使用して画像を分類すると、95% 以上の精度を得ることができました。

私の質問は、ピクセルで学習した BOW が機能で学習した BOW よりも優れているのはなぜですか?

ここに画像の説明を入力

大腸内視鏡画像の正常異常分類

    Figure 1: a normal colon image
    Figure 2: an image with polyp

score 3 · Accepted Answer

画像パッチから特徴を抽出するための2つの方法についての私の理解は次のとおりです。

特徴選択="PCA、k-meansを実行するか、ピクセルのサブセットを選択して、これらの抽出された値のベクトルを作成します"

ピクセル値="画像のRGB値からベクトルを作成"

実際、BOW機能から良い結果を得るために、人々は比較的複雑なアルゴリズムを使用して個々の機能を導出することがよくあります。

http://vision.stanford.edu/projects/totalscene/index.htmlのプロジェクト（参考文献＃1の論文）では、著者は画像ブロックとセグメンテーションの両方からBOW機能を取得しています。画像ブロックの場合、SIFT特徴を抽出し、セグメントごとに、形状、色、位置、およびテクスチャの特徴を取得します（セクション2.1を参照し、使用する特徴の詳細については、リファレンスに従ってください）。

「シーンを幾何学的で意味的に一貫性のある領域に分解する」で。（Gould et。al。）形状、色、エッジなどの特徴は、ブーストされたロジスティック回帰分類器、ポッツモデル、ガウス混合モデルのトレーニングなどを行うことによって導出されます。

ピクセルベクトルを打ち負かす特徴を抽出するために、このような集中的な手法はおそらく必要ありませんが、何が効果的であるかを確認するには、必ず文献を参照する必要があります。

テクスチャ応答を抽出するためのSIFT機能、色ヒストグラム、およびフィルターは非常にうまく機能しているようであり、適度な量のソフトウェアライブラリもサポートしています。

image-processing - 分類のための言葉の袋 - 特徴とピクセル

1 に答える 1

Related

Reference