許容できる複雑さの効率的な方法を見つけようとしています
- 画像内のオブジェクトを検出して、周囲から分離できるようにする
- そのオブジェクトをそのサブパーツにセグメント化し、それらにラベルを付けて、自由に取得できるようにします
画像処理の世界に足を踏み入れてから 3 週間が経ちましたが、非常に多くのアルゴリズム (ふるい分け、スネーク、より多くのスネーク、フーリエ関連など) とヒューリスティックスについて読んだので、どこから始めてどれから始めればよいかわかりません。私が達成しようとしていることに「最適」です。対象の画像データセットがかなり大きいことを念頭に置いて、OpenCV で実装されたアルゴリズムを使用する必要があるのか、独自のアルゴリズムを実装する必要があるのかさえわかりません。
要約:
- どの方法論に焦点を当てる必要がありますか? なんで?
- そのようなものにOpenCVを使用する必要がありますか、それとも他の「より良い」代替手段がありますか?
前もって感謝します。
編集 -- データセットに関する詳細情報
各データセットは、同じ製品を共有する 80K の製品画像で構成されています。
- T シャツ、時計、靴などのコンセプト
- サイズ
- オリエンテーション (90%)
- バックグラウンド (95%)
各データセットのすべての写真は、製品自体を除けばほぼ同じに見えます。もう少し明確にするために、「監視データセット」のみを考えてみましょう。
セット内のすべての写真は、ほぼ同じように見えます。
(繰り返しますが、時計自体とは別に)。ストラップと文字盤を取り出したい。問題は、さまざまな時計のスタイルとその形状がたくさんあるということです。これまで読んだことから、さまざまなスタイルのストラップと文字盤を一致させるには、曲げたり伸ばしたりできるテンプレート アルゴリズムが必要だと思います。
3 つの異なるテンプレート (ストラップの上部、ストラップの下部、文字盤) を作成する代わりに、1 つだけ作成して 3 つの部分に分割するのが合理的です。そうすれば、各パーツが意図したとおりに相互に検出されたことに十分な自信が持てます。たとえば、文字盤がストラップの下部より下に検出されることはありません。
私が遭遇したすべてのアルゴリズム/方法論から、アクティブな形状|外観モデルが最も有望なもののようです。残念ながら、私は降下の実装を見つけることができず、それが最善のアプローチであり、自分で作成するのに十分な自信がありません.
私が本当に探しているもの(アルゴリズム/ヒューリスティック/ライブラリ/など)を誰かが指摘できれば、私は感謝しています。繰り返しますが、私の説明が少し曖昧であると思われる場合は、お気軽に、より詳細な説明を求めてください。