3

入力画像にスタンプの刻印が含まれているかどうかを判断し、その場所を返すアプリケーションに取り組んでいます。RGB画像の場合、カラーセグメンテーションを使用して検証を行っています(さまざまな形状係数を使用)。グレースケール画像の場合、SIFT +検証でうまくいくと思いましたが、SIFTを使用すると、入力画像で取得したスタンプのみが見つかりますデータベース。

理想的なケースでは、下の画像に示すように、非常にうまく機能します。

図 1. http://i.stack.imgur.com/JHkUl.png

この問題は、入力画像にデータベースに存在しないスタンプが含まれている場合に発生します。最初にやったのは、入力画像のスタンプと似たようなスタンプを比較すると、一致するキーポイントがあるかどうかを確認することでした。ほとんどの場合、一致するキー ポイントは 1 つではなく、図 2 に示すように、一致するキー ポイントがあれば、スタンプではなく入力画像の他の部分を参照します。

図 2. http://i.stack.imgur.com/coA4l.png

また、スタンプが円形であるため、入力画像と円画像の一致を見つけようとしましたが、円画像には重要なポイントがほとんどありません。

だから、この正確なケースでSIFTをもう少し便利にする別のアプローチがあるのだろうか? データベースからすべての記述子とキーポイントを使用してマトリックスを作成し、入力画像とマトリックスの間の最も近いユークリッド距離を探すことについて考えましたが、データベース全体に一致するキーポイント (不要な) がたくさんあるため、おそらく機能しません。 (図 2 参照)。

私は Matlab を使用しており、VLFeat と D. Lowe SIFT の両方の実装を試しました。

編集:

そこで、SIFT に画像上のユーザー定義点の記述子を強制的に計算させる方法を見つけました。私のテスト画像には円が含まれており、記述子が計算され、図 1 と 2 の下のものを含む入力画像と照合されました。このプロセスは 0 から 10 までのスケールで繰り返されました。

4

2 に答える 2

1

これは最初のヒントにすぎず、SIFT の質問に対する完全な回答ではありません。

私の印象では、SIFT を介して円の画像と照合して円を検出することは、特に検出したい円の内部に未知のテクスチャがある場合は、最善の方法ではありません。

円検出のテキスト アルゴリズムはHough transformであり、主に線検出に使用されますが、少数のパラメーターで記述できるあらゆる種類の形状で機能します (同僚は、3 を超えると厄介なことになると教えてくれますが、円は単にX、Y、および r があります)。ファイル交換にはいくつかの実装があり、リンクは一例にすぎません。ハフ円の検出では、検出する半径に上限を設定する必要がありますが、これはアプリケーションでは問題ないようです。

あなたが提供した例から、円を確実に検出できれば、かなり遠くまで到達するはずです。

于 2012-08-02T12:18:30.543 に答える
0

実際、SIFT がこの問題を解決するとは思いません。私はかなり長い間 SIFT をいじっていましたが、私の結論は、SIFT は同一のパターンを識別するのには非常に優れていますが、類似のパターンには適していないということです。SIFT 特徴ベクトルの構成を見てみましょう。記述子は、いくつかの勾配のヒストグラム (!) で構成されています。スタンプに非常によく似たブロブのような構造を持つパターンがデータベースにある場合は、可能性があります。しかし、これが成り立たない場合、あなたはあまり幸運ではないと思います.

私の観点からすると、あなたは同一オブジェクト (スタンプ) を見つける問題を解決し、類似オブジェクトの検索にまで拡張されまし。これは同じように聞こえますが、私の過去の調査では、これらの問題は関連しているだけで、あまり同一ではないことがわかりました.

アプリケーションに実行時の制約はありますか? 他のアプローチがあるかもしれませんが、この場合、可能な制約に関するより多くのインプットが役立つかもしれません。


制約に関する更新:次のタスクは、未知のスタンプを検出する
ことかもしれませんね? これは分類作業のように聞こえます。

あなたの場合、最初に画像をスタンプ/スタンプなしに分類する記述子/表現(またはSVM)を見つけようとします。これを評価するために、グラウンド トゥルースと、適切な量の「不明な」スタンプと、スタンプを含まない手紙からのランダムなスナップショットなどのその他の画像を含むデータベースをセットアップします。これがテスト セットになります。

次に、いくつかの記述子/表現を試して、画像間の距離/類似性を計算し、テスト セットをクラス STAMP / NO-STAMP に分類します。分類でうまく機能する記述子/距離尺度 (または SVM) を見つけたら、文字に対してスライディング ウィンドウ アプローチを実行してスタンプを見つけることができます。スライディング ウィンドウ アプローチは確かに非常に高速な方法ではありませんが、非常に簡単な方法です。少なくともこのポイントに到達したら、検出を調整できます-たとえば、興味深いポイント検出器に基づいて..しかし、一歩ずつ...

于 2012-10-17T19:15:25.357 に答える