15

許容できる複雑さの効率的な方法を見つけようとしています

  • 画像内のオブジェクトを検出して、周囲から分離できるようにする
  • そのオブジェクトをそのサブパーツにセグメント化し、それらにラベルを付けて、自由に取得できるようにします

画像処理の世界に足を踏み入れてから 3 週間が経ちましたが、非常に多くのアルゴリズム (ふるい分け、スネーク、より多くのスネーク、フーリエ関連など) とヒューリスティックスについて読んだので、どこから始めてどれから始めればよいかわかりません。私が達成しようとしていることに「最適」です。対象の画像データセットがかなり大きいことを念頭に置いて、OpenCV で実装されたアルゴリズムを使用する必要があるのか​​、独自のアルゴリズムを実装する必要があるのか​​さえわかりません。

要約:

  • どの方法論に焦点を当てる必要がありますか? なんで?
  • そのようなものにOpenCVを使用する必要がありますか、それとも他の「より良い」代替手段がありますか?

前もって感謝します。

編集 -- データセットに関する詳細情報

各データセットは、同じ製品を共有する 80K の製品画像で構成されています。

  • T シャツ、時計、靴などのコンセプト
  • サイズ
  • オリエンテーション (90%)
  • バックグラウンド (95%)

各データセットのすべての写真は、製品自体を除けばほぼ同じに見えます。もう少し明確にするために、「監視データセット」のみを考えてみましょう。

セット内のすべての写真は、ほぼ同じように見えます。

ここに画像の説明を入力

(繰り返しますが、時計自体とは別に)。ストラップと文字盤を取り出したい。問題は、さまざまな時計のスタイルとその形状がたくさんあるということです。これまで読んだことから、さまざまなスタイルのストラップと文字盤を一致させるには、曲げたり伸ばしたりできるテンプレート アルゴリズムが必要だと思います。

3 つの異なるテンプレート (ストラップの上部、ストラップの下部、文字盤) を作成する代わりに、1 つだけ作成して 3 つの部分に分割するのが合理的です。そうすれば、各パーツが意図したとおりに相互に検出されたことに十分な自信が持てます。たとえば、文字盤がストラップの下部より下に検出されることはありません。

私が遭遇したすべてのアルゴリズム/方法論から、アクティブな形状|外観モデルが最も有望なもののようです。残念ながら、私は降下の実装を見つけることができず、それが最善のアプローチであり、自分で作成するのに十分な自信がありません.

私が本当に探しているもの(アルゴリズム/ヒューリスティック/ライブラリ/など)を誰かが指摘できれば、私は感謝しています。繰り返しますが、私の説明が少し曖昧であると思われる場合は、お気軽に、より詳細な説明を求めてください。

4

2 に答える 2

8

あなたが言ったことから、ここに一目でポップアップするいくつかのことがあります:

  • これを行う最も簡単な方法は、イメージを2値化し、OpenCVまたはCvBlobライブラリを使用して連結成分を実行することです。複雑でない背景を持つ単純な画像の場合、これは通常オブジェクトを生成します

  • ただし、サンプル画像を見ると、テクスチャベースのセグメンテーション手法の方がうまくいく可能性があります。時計の文字盤、ストラップ、背景はテクスチャ/粗さが賢明に異なり、これはそれらを分離するための理想的な方法です。

    部分の粗さは、固有変換によって簡単に見つけることができ(SOについて少し説明します。そこにある研究論文へのリンクを確認してください)、平均シフトフィルターを固有変換の出力に適用できます。これにより、テクスチャに応じて明確に分離された領域が得られます。ピラミッド型の平均シフトとSVDによる固有値の検出は、どちらもOpenCVに実装されているため、独自のコードを最適化できない限り、速度と効率に関する限り、組み込み関数(存在する場合)を使用する方が良い(そして簡単です)。

于 2011-08-29T01:17:54.337 に答える
3

私は問題を好転させると思います。文字盤を探す代わりに、時計の一連の堅牢な機能を使用して、対象の画像をテンプレートに「縫い付け」ます。最初の時計の文字盤には白の四角形があり、2 番目の時計には白い円がいくつかあります。時計の種類ごとに次のようにします。

  • 文字盤の四角または円を分割します。セグメンテーションの手順は、通常、スケールと光の両方に依存するため、注意が必要です。
  • 上記で見つかった特徴領域の中心または角を推定します。これらが新しい特徴点です。
  • ハンガリー語アルゴリズムを使用して、テンプレート ウォッチとターゲット ウォッチの間で機能を一致させます。または、元の画像の各特徴点の周囲を取得し、相互相関を使用してこれらを一致させることができます
  • テンプレートとターゲットの間のマッチング機能を使用して、スケーリング、回転、平行移動を推定します
  • 画像をステッチする
  • 画像は既知の形式になっているため、事前に設定された座標を介して領域を簡単に抽出できます。
于 2011-08-29T22:07:14.990 に答える