問題タブ [haar-classifier]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
opencv - Haar 分類子の堅牢性 - 自分自身を訓練するか、代替手段が存在するか?
Haar 分類子 (正面の顔) を使用して顔を検出するのに 1 日を費やした後、顔の認識/検出に失敗することがわかったのは次のとおりです。
- 正面からのショットでも、頭が左右にわずかに傾いている
- 厚い口ひげまたはあごひげ
- 淡い/白い肌色でない顔 (いくつかのアフリカの顔の検出に失敗し、インド亜大陸のいくつかの顔を検出できませんでした)
- 極端なモンゴロイドの特徴
- 少しでも日陰がある顔、つまり、非常に均一に照らされていない顔
scaleFactor と minNeighbours を変更しようとしましたが、成功しませんでした。
したがって、本質的には、理想的な写真で狭い範囲の顔を検出できるようになるようです。たとえば、色白の人、直立した顔 (頭の傾きがない)、最小限の顔の毛、顔の均一な照明などを含みます。
または、何か見逃しましたか?更新/挿入する特定の設定または手順はありますか?
OpenCV にバンドルされている Haar Cascade XML を作成するために使用された顔のタイプ (正の ID) について、どこかに文書化されていますか?
OTOH、私はこの優れた Q&A を見つけましたが、SO には他にも多くの質問があり、人々が独自の Haar Cascades を作成することにほとんど成功していないことを示しています (課題は正しくトレーニングされているようです)。これにアプローチする方法に関するガイダンスは非常に役立ちます。
qt - haarcascade_fullbody.xml でプログラムがクラッシュする
QtのOpenCVを使用しています。
いくつかのオブジェクトを検出できるプログラムの実行に取り組んでいます。これまでのところ、顔、目、鼻の検出器を作成できましたが、全身を検出しようとすると、完全に間違った検出が行われるか、まったく検出されないか、プログラムがクラッシュします。全身を検出するには、他の検出と同じコードを使用しますが、haarcascade_fullbody.xml ファイルを使用します。同じコードを使用することはできませんか? 全身ではなく、他の機能で機能するのはなぜですか?
また、 https: //github.com/Itseez/opencv_extra/tree/master/testdata/cv/latentsvmdetector/models_VOC2007 から OpenCV の事前トレーニング済みモデルを使用して車の検出を実装しようとしましたが、解析エラーが発生します。
前もって感謝します!
MainWindow からのコード:
DetectFeature からのコード:
opencv - haar 分類器で何を検出できますか?
カスケードをトレーニングして 1 つのオブジェクトを認識させたいとしますが、このオブジェクトの形状は異なります。たとえば、カップを認識したい場合。カップにはさまざまな形がありますが、類似点もあります。または別の例: ステアリング ホイール。オブジェクトがハンドルであることは常にわかりますが、形状は異なります。私の質問: 1 つのオブジェクトのさまざまな形状のほとんどを認識するようにカスケードをトレーニングできますか?
machine-learning - Haar Like Features の (初期) セットの定義
カスケード分類子 (haar のような機能を使用) に関しては、AdaBoosting などのメソッドを使用して、検出に「最適な」機能を選択することを常に読んでいます。ただし、これは、ブーストを開始する機能の初期セットがある場合にのみ機能します。
24x24 ピクセルの画像を考えると、162,336 の可能性のある haar 特徴があります。私はここで間違っているかもしれませんが、openCV のようなライブラリーがこれらすべての機能に対して最初にテストを行うとは思いません。
私の質問は、最初の機能がどのように選択されているか、またはどのように生成されているかです。機能の初期数に関するガイドラインはありますか?
そして、162,336 のすべての機能が最初に使用された場合。それらはどのように生成されますか?
computer-vision - Viewpoint invariant detection and recognition of simple 3d objects from image
I have a set of simple rigid 3D objects that I wish to detect and recognize from an image (let's say 5 to 10 classes). The objects are simple in sense that they are cylinders in one color or rectangles with simple patterns (stripes for example) or some similarly simple shape. The objects are significantly different from one another (there aren't for example two classes where one is a large cylinder and another one is the same but smaller cylinder). Because the textures are pretty simple (solids and/or simple patterns), bag-of-words approach fails (they do not contain significant number of unique edges).
While one possible approach is coding manually each classifier (manual feature extraction etc), is there a simple data driven approach (Haar/LBP classifier for example) that would work? If Haar or LBP are good for solving this problem, how would one solve the problem of unknown relative viewpoint (and by such perspective distortion, rotation, etc)? Would just providing positive images from all possible viewpoints for an object converge or is there something else that's usually done? The detection and recognition should run in real-time.