0

目的:人間の行動を検出/判断する、ラベルを読むためにアイテムをピッキング/持ち上げてラック (店舗内) に戻す、椅子、ベンチ、はしごなどで原子オブジェクトを座ったり、取り付けたり登ったりする.

環境:店/店、ほとんど明るいです。カメラ (VGA -> 1MP)、固定 (つまり、PTZ ではない)。

制約:

  1. 既知および未知の人間の存在。
  2. 一定期間、ストア内のオブジェクト (販売アイテム) が再配置される可能性があります。
  3. 照明の経時変化の可能性。例: 店舗の正面エリアは、日中は十分な日光を浴び、夜は人工光に変わります。また、夜間はより多くのライトをオンにすることができます。

質問:

  1. OpenCVは顔検出に最適で、顔認識に使用できることは理解していますが、「アクション」の分析、つまり座る行為、棚から物を持ち上げる行為に使用できますか? もしそうなら、私が深く掘り下げる必要があるこれらのアルゴリズムのいくつかは何ですか?

  2. 店舗のカメラはほとんどが天井の高さに設置されているため、通常は正面からの顔ではなく、上から見下ろしたものがほとんどです。Haar Cascade (PCA) があまり使用できないことは理解していますが、3D ヘッド ジオメトリを決定するには他の方法が必要です。そのようなタスクに使用する必要がある他のライブラリ (OpenCV 以外) はありますか? 同じためのオープンソース ライブラリはありますか?

4

3 に答える 3

20

ときどきここに来て、コンピューター ビジョンの最も困難な研究問題のいくつかを解決するための支援 (またはコード) を求める人がいます。最も注目されている学者や科学者によって解決されなかった問題。時々、彼らは SF 映画で見たアルゴリズムを尋ねてきます。OpenCVは「十分に友好的ではない」ため、彼らは不満を抱きます。

真剣に、あなたが画像処理の博士号を持つチームで、天才的なプロジェクトに取り組んでいるなら、ここからのアドバイスは必要ありません。そうでない場合、それを行う可能性は非常に低くなります。

合理的なリソースと正確さでできることは、店内の人々を追跡することです: 移動平均背景減算器 (OpenCV で利用可能) を使用して、空の店舗がどのように見えるかを判断し、各フレームからその背景を減算して、来て消えます。ブロブ分析ライブラリでそれらを抽出できます。カルマン フィルター (またはより単純なトラッカー) は、移動するオブジェクトを追跡するのに役立ちます。

幸運を!

于 2012-04-03T07:00:55.043 に答える
1

これはかなり難しい問題です。これらの人たちとの私的な会話からhttp://www.picar.us/私は、ダンスやスケートボードなど、ビデオ内の人間の行動を検出するルーチンがいくつかあると推測しています。このようなものは、彼らのオープン ソース ライブラリには含まれていませんが、質問すれば役立つかもしれません。

于 2012-04-03T04:08:56.190 に答える
1

人間の行動認識の問題は、通常、bag-of-wordsモデル表現と、数百のラベル付きデータを使用した線形 (または非線形) 教師付き分類スキームを使用して処理されます。

于 2012-04-03T08:31:12.870 に答える