2

環境:

私は Kinect から RGB-D ビデオを持っています。これはテーブルに向けられています。単独で、または一度にいくつかを識別する必要がある約 12 個のオブジェクトのライブラリがあります。SURF を適用する前に、RGB 画像からの SURF の抽出と検出、320x240、グレースケールへのダウンスケーリング、コントラストのストレッチ、ヒストグラムのバランス調整による前処理を行ってきました。ビデオ画像の静止画で検出されたキーポイントの中から選択する投げ縄ツールを作成しました。次に、これらのキーポイントを使用して、ライブ ビデオ フィード内のオブジェクトを識別するために使用されるオブジェクト記述子を作成します。

問題:

SURF の例は、適切な量のテキストのような特徴の詳細を持つオブジェクトの識別に成功したことを示しています。ロゴとパターン。識別する必要のあるオブジェクトは比較的単純ですが、特徴的な形状をしています。私の静止画で見つかった SURF の特徴は、一貫している場合もありますが、ほとんどが重要でない表面の特徴です。たとえば、木の立方体があるとします。SURF は 1 つの面で数ビットの粒子を検出し、他の面では失敗します。等距離で直角に 4 つの角があることを検出する必要があります。私のオブジェクトはどれもあまりパターンを持っていませんが、すべてが独特の対称的な形状と色を持っています. 携帯電話、ロリポップ、ナイフ、ボウリングのピンを考えてみてください。私の考えでは、オブジェクトの見た目が大きく異なる方向ごとにオブジェクト記述子を構築できると考えていました。ボウリング ピンの 2 つの記述子: 1 つは立っていて、もう 1 つは横になっています。携帯電話の場合、1 つを前面に置き、もう 1 つを背面に置きます。私のレコグナイザーには、オブジェクトが積み重ねられている場合に、回転不変性とある程度のスケール不変性が必要です。ある程度のオクルージョンに対処できることは望ましいことですが (SURF は十分に動作します)、最も重要な特性ではありません。スキュー不変性が望ましいと思われます。SURF は、手で持った対象物を斜めに印刷した紙に適しています。

質問:

間違った縮尺でフィーチャを見つけるために間違った SURF パラメータを使用していませんか? この種のオブジェクト識別のためのより良いアルゴリズムはありますか? Kinect の深度データを RGB データと共に、またはその代わりに使用する SURF のようにすぐに使用できるものはありますか?

4

1 に答える 1