14

ビーチから撮影した航空写真でアザラシの子 (動物) を検出してカウントするプロジェクトがあります。アザラシの子は、茶色で大きい大人のアザラシに比べて、黒くて小さいです。

一部のアザラシの子が重なっている/部分的に隠れています。ビーチの色は黄色に近いですが、検出が困難な黒い岩がいくつかあります。

私のプロジェクトに最も適した記述子は何ですか? HOG、SIFT、Haar のような特徴?

この問題の理論部分を求めています。私のプロジェクトを実装するには、最初のステップは、オブジェクトを最も表現できる正しい記述子を選択する必要があると思います。次に、(いくつかの弱い機能を組み合わせる必要はありませんか?)boosting/SVM/neural_network などの機械学習方法を使用して分類器をトレーニングします。 ?

サンプル画像: ここに画像の説明を入力

4

3 に答える 3

2

適切な記述子を選択することが適切な出発点であることに同意するかどうかはわかりません。基本的な問題は、すべてのオブジェクトの形状が似ていることです。また、各動物にはかなりの勾配があります。ポーズの複雑さは別の問題です。問題をさらに 2 つの簡単な手順に分割します。1. 一意のオブジェクト検出 (エッジ検出、流域、グラフ カットなど)。「血球を数える」問題のようなもの。2. 色と面積に基づくオブジェクトの分類 (カメラの視点に正規化)。各オブジェクトの「黄色」の色のピクセルと「黒」の色のピクセルの割合を計算し、それらの値をオブジェクト サイズと共にオブジェクト分類器への入力として使用します (ここでは、ニューラル ネットワークが楽しいソリューションです)。

かなり雑然としたシーンなので、これらのアルゴリズムは両方とも微調整が必​​要になると思います。アナリストとのある程度の対話が要件で許可されている場合は、いくつかのスライダーを提供して、アナリストがアルゴリズムの各しきい値を調整できるようにします。

于 2011-04-25T01:23:11.223 に答える
2

コンピュータ ビジョン アルゴリズムの精度は、特定の問題に合わせて微調整できるかどうかに大きく依存しているようです。アルゴリズムに渡す写真について、すべて同じようなビーチ シーンのアザラシの航空写真であるなどの仮定を立てることができれば、それを利用できます。ローカル機能に凝りすぎる前に、流域セグメンテーションなどを試して、背景以外のセグメントの数を数えてみてください。Watershed は、「背景」セグメントと「前景」セグメントを区別するために入力に関する事前知識を組み込むための「マーカー」と呼ばれる便利なフレームワークを提供します。

このようなアプローチは、ローカル フィーチャよりも簡単で、おそらくより正確かもしれません。私の経験では、SIFT および SURF 機能を使用して、有機的な主題 (顔や動物など) から多くの意味のある特徴を抽出して照合することはできませんでした。私にとっては、角度の多い部屋や建物の写真でうまく機能する傾向がありました.

于 2011-06-04T16:45:50.700 に答える
0

よくわかりませんが、捕食者のアルゴリズムを調べてみてください。アザラシの赤ちゃんがどのように見えるかを簡単に教えることができるからです。 YouTubeビデオ、説明、リンクはこちら

于 2011-04-18T15:41:35.800 に答える