私は OpenCV とそのための EmguCV .NET ラッパーの調査を始めたばかりであり、その機能の全体像を理解している人や、おそらく私が達成する必要があるものと同様のタスクに取り組んでいる人からの一般的な指示が必要です。
一連の静止写真があり、各画像にはオブジェクトが表示されるか、何も表示されません。オブジェクトは金属製のハードウェア (ボルト) であり、長さが画像の上部/下部と平行になるように横向きに配置されます (つまり、写真は上から撮影されます)。オブジェクトが存在する場合、それは約 100 の個別のタイプのボルトの 1 つであり、いくつかは非常に類似していますが、同一ではない機能と寸法を備えています。たとえば、それらはすべてプロファイルがほとんど長方形ですが、長さと幅 (直径) が異なり、六角形または円形のヘッドを持つことができます (プロファイルでは、それぞれ長方形または円の副セグメントとして表示されます)。 ) または、皿穴を開けたアプリケーション用の円錐形のヘッドがあります。パーツの種類のイラスト I'
(ソース: donsnotes.com )
すべてのサイズとタイプが区別されるように分類する必要があります。1-3/8" ボルトは、同じ直径で同じヘッド タイプであっても、1-1/2" ボルトとは異なるものとして分類する必要があります。サイズ間の最小の長さの違いは、標準の 1/16 インチではなく、1/8 インチです。
それが重要な場合、私は次のことを適切に管理しています。
- 照明 (ただし、バックライトは実用的ではありません)
- 背景の見え方(背景減算に役立つかも?)
- カメラからオブジェクトまでの距離 (同一のオブジェクトは、画像では常に同じサイズに見えます)
- 通常、ボルトの位置 - 画像フレームの上端/下端と平行に、横に水平に配置されます。頭が左右どちらに向いているか制御できません。
残念ながら、私が何をする必要があるかを直接説明しているオンラインの論文や記事は見つかりませんが、色付きのボールを見つけたり、長方形を見つけたりするような簡単なタスクを説明している記事はたくさんあります. 多数の異なるが類似した形状のそれぞれを識別して分類することについては何も見つかりません。私は提案された OpenCV の本を 2 冊持っていますが、それらは素晴らしいものですが、この問題に対処していないようです。
サンプル画像でかなりきれいなキャニー エッジを見つけましたが、照明のためにパーツの内部に多くのノイズがあります。これにより、きれいなハフの線分を見つけるのがむらになります。
キャニーエッジ全体で測定して計算された絶対次元を使用して、可能な一致のリストを絞り込む必要があるかどうかはわかりません-その後、カスケード分類器のようなより堅牢なものを使用します...? または何。
私は本当に、一般的な戦略または正しい方向へのポイントについて誰かの意見を探しています...
誰か試してみるために何かをくれませんか?私は本当に途方に暮れています。
ありがとう!