0
4

1 に答える 1

0

タグ SIFT は、質問/抜粋がコンピューター ビジョンで使用されるローカル イメージ機能に関連していることを示します。あなたが研究しているアルゴリズムがエッジを削除する方法は、抜粋ではカバーされていません。画像のエッジを表示するには、 Wikipedia の Canny Edge Detector を使用できます。あなたの抜粋は基本的に、グレースケール画像でコーナーがどのように検出されるかを説明しています。これは特徴検出に役立ちます。

動機は次のとおりです。

  • 自然の画像には、多くの複雑な視覚情報が含まれています。さまざまな画像で検出したいオブジェクトは、回転、変形、隠蔽、さまざまな照明条件での表示などが可能です。これにより、問題が難しくなります。
  • これに対処するためのアイデアは、オブジェクトの小さな部分を識別し、画像全体でそれらを再検出することです。これらの部分の十分に大きなサブセットが別の画像に存在し、それらが幾何学的に一貫している場合、オブジェクトが別の画像に部分的に表示されていると主張できます。
  • ここで、長方形のスライディング ウィンドウで画像をループする場合、別の画像で再検出できるように、そのパッチに十分な視覚情報が含まれているかどうかを判断する必要があります。これは未解決の問題です。ウィキペディアの関心点検出も参照してください

低レベルで問題を単純化し、理論的な例を使用して概念上の誤りを回避しようとします。

  • 簡単にするために、色を無視すると、グレースケールの画像になります。
  • 白いピクセルだけのパッチは、白い壁全体で一意に識別できるわけではありません。スケール、回転、単に色以外のすべてが曖昧です。これは、抜粋の「平坦な領域」です。
  • そのローカル パッチに 1 ピクセルの太さの黒い直線があるとします。これで、あいまいさが少なくなりました。たとえば、別の画像で太さ 2 ピクセルの黒い直線を見つけた場合、それは同じ線である可能性があり、倍率は 2 になります。しかし、線はどこから始まり、どこで終わるのでしょうか? これは、一般に「エッジ」と呼ばれます。
  • ただし、水平線と垂直線からの黒いクロスは、クロスの「開始」と「終了」のあいまいさがなく、簡単に識別できます。
  • 同様に、2 本の線が 1 点で終わる「コーナー」は、検出するのに適した特徴です。

したがって、「コーナーは重要なキーポイントです」というステートメントです。ただし、「ブロブ」と「リッジ」もあります ( Wikipedia の画像の特徴の種類)。画像勾配演算子は、コーナーのような画像領域を強調表示できる機能です。

  • グラデーションは 2 つのピクセルの差と考えてください。垂直線の場合、水平方向にピークが得られます (大きな差)。水平線の場合、垂直方向にピークが得られます。
  • この勾配演算子をパッチ内の各ピクセルに適用し、それからヒストグラムを作成すると、抜粋で言及されている 3 つのケースが適用されます。
  • パッチは回転しているように見えるため、通常は、最初に方向付けられたグラデーションのヒストグラムを分析して、キーポイントの方向として主要な方向を見つけます。次に、直交方向に 2 番目のピークがあるかどうかを確認します。
于 2013-07-26T10:05:30.353 に答える