1

コンピュータ ビジョンを使用して、次のことを行いたいと考えています。

カメラは建物の外に取り付けられ、下の通りのビデオ ストリームをキャプチャします。カメラは、道路から約 5 ~ 6 メートル上に設置されています。

特定の種類の帽子 (白い、丸い) をかぶった人がカメラにキャプチャされるたびに、イベントがトリガーされる必要があります。

この種の動作を実装するには、どのアルゴリズムを検討する必要がありますか?

これは、サンプル データを使用してアルゴリズムをトレーニングすることによって達成するのが最善ですか?それとも、このタイプの帽子を探すように指示する別の方法がありますか?

また、ビデオの複数のフレームを使用して検出の品質を向上させるにはどうすればよいですか?

白い丸い帽子をかぶった美しい人々

編集:帽子の写真を追加しました

4

1 に答える 1

3

コメントですべてを行う前に、ここで回答を開始します。

あなたが投稿した最初のリンクは、単純な色ベースの検出について説明しています。それを試すことはできますが、画像内に似たような色のピクセル クラスターが他にある場合は失敗します。それを追跡と組み合わせるというあなたのアイデアは良いです。クラスターを識別し、複数の画像にわたって軌跡を作成し、もっともらしい軌跡のみをヒットとして受け入れます。堅牢な追跡を行うには、カルマン フィルター処理を検討することをお勧めします。遭遇する可能性が最も高い問題は、カメラが提供する画像では「白い」帽子がほとんど「白い」ことはないということです。

あなたが参照する2 番目のリンク- Haar のような機能に基づくブーストされた分類子 - は、より複雑なオブジェクトを検出するためのものです。白い塊を見つけるのにはおそらく役に立たないでしょう。追跡について学ぶために時間とエネルギーを投資してください。

ここで繰り返しますが、「コンピューター ビジョンの問題を解決する」ことは、「配列を並べ替える」ようなものではありません。OpenCV は C++ 標準ライブラリではありません。std::map赤黒木について何も知らなくても使えます。しかし、(IMHO) 数学と理論を十分に理解していなければ、Vision API を使用することはできません。実用的なソリューション Computer Vision は通常、特定の問題シナリオに合わせて大幅に調整されています。それが衒学的に聞こえる場合は申し訳ありませんが、あなたの質問が打ち負かされた理由を説明しています.

于 2013-03-05T16:46:10.483 に答える