問題タブ [haar-wavelet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
haar-wavelet - Viola-Jones の顔検出器は、複数のサイズの顔に対してどのように機能しますか?
静止画像の顔を検出するために Viola-Jones の顔検出器を実装していますが、トレーニング サイズと同じサイズの画像に対して十分に機能します。しかし、顔検出器が複数のサイズの顔に対してどのように機能するかわかりませんか?
画像のトレーニング サイズが 24*24 で、30*30 の検出器ウィンドウで顔を検出したい場合、haar-feature を再スケーリングして、30*30 サイズの検出器ウィンドウで同じように動作するようにする必要があります。しきい値。
もう1つ、Haar-featureの位置も検出器ウィンドウのサイズによって変化しますか?もしそうなら、どのように?
threshold - Haar-feature のしきい値は、Viola-Jones が論文で説明している唯一の方法で計算されますか?
Viola-Jones の顔検出アルゴリズムを実装していますが、haar-feature のしきい値について少し混乱しています。フォローを使用して、haar-feature のしきい値を計算しています。手順:
a) 同じ位置に対応するすべてのポジティブ (顔) 画像の haar-feature 値を計算します。b) 最小特徴値と平均特徴値の間にあるすべての特徴値を取得してリストを取得します。images(Pos.) 顔と偽陽性 (FP) の数として分類します。d) 機能値は、最大 (Pos-FP) を取得する特定の機能のしきい値と見なされます。
反対に、ブースティングの各ラウンドで、Haar 機能のしきい値は同じままです。Viola-Jones の論文で説明されているように、Haar 機能のしきい値は、ブースティングのすべてのラウンドで変化します。
私の質問は次のとおりです。1) Haar-feature しきい値の計算に正しい方法を使用していますか? 2) ブーストのラウンドごとに、しきい値を変更する必要がありますか?
私はPythonを使用しています。
ありがとう!
android - Haar のようなアルゴリズムを使用した Android と OpenCV の検出とパフォーマンス
OpenCVを使用して、「中レベル」のAndroidデバイスで適切なパフォーマンスで頭の検出と追跡を実現する方法を探しています。
私が考えたこと(Haarのようなアルゴリズムを使用):
すべてのビデオ フレームのサイズを小さくしてから、グレースケールに変換します。
最初のフレーム:
- Haar カスケードを使用してフェイス バインドを見つけて保存する
- フェイス バウンドの目を見つける (他の Haar テンプレートを使用)
- 口も同じ
次のフレームの場合:
- 顔の古い境界を使用して展開し、頭 (位置が変更されたもの) を見つけます。
- 拡張境界で面を検索します。
- 顔の中に目を見つけます。
- 顔の中に口を見つけます。
ライブ ストリーミング ビデオでのこのサイクルのパフォーマンスが心配です。スケジュール的にいいのか、それとも別のアルゴリズムを使うべきなのか? Haar のようなものは非常に重く見えます。
私のアプリケーションは、フレームごとに、目と口の座標を保存する必要があります。そのため、頭の位置を含む現在のフレームと、目と口の初期位置を含む最初の頭のバウンディング ボックスを横断してこれらの値を取得することはできません。
python - haar 特徴値を評価する最速の Python の方法
こんにちは、私は Python が初めてで、Python を使用して Viola-Jones の顔検出アルゴリズムを実装しています。Adaboost を使用して haar-feature を選択している間、私のコードでは、ブーストの各ラウンドで 1 つの haar-feature を選択するのに非常に時間がかかります (約 18 時間近く)。どういうわけか、haar 機能の評価にかかる時間は、私のコードで最も時間のかかる作業であることがわかりました。以下のpythonコードを提示しています:
リスト: インテグラル イメージのリスト
(x,y,h,w,f,p): 位置 (x,y) の Haar 特徴。h と w は、haar 機能の 1 つの四角形の高さと幅です。これは、2 つの四角形 ( |----|----|) の高さの合計が h で、幅の合計が 2*w であることを意味します。f は haar 特徴タイプで、p はパリティです。
上記のコードは、2 つの haar 機能タイプ two-rectangle Horizontal haar-feature と two-rectangle vertical haar feature を評価します。
Pythonを使用してhaar-featuresを評価する最速の方法はありますか? タイミング要因に対処できるように、上記のコードを改善するための提案。ここで私が最も気になるのは、何よりもタイミング要因です。
ありがとう!
opencv - サッカーボールの検出と追跡 - AI 技術を使用?
以前にも同様の質問をしたことがありますが、私の質問は実際には答えられていないと感じました。Circle Hough Transform を使用して、ボールを検出して追跡しています。ただし、検出された円が実際にボールであるかどうかを確認するために、追加のチェックが必要です。
私は、ニューラル ネットワーク、ハール分類器、SVM など、そのようなもの (つまり AI) を使用することを考えていました。しかし、それは信じられないほど堅牢である必要があり、私はこれらの AI 手法に慣れていないため、学習に時間を費やすのに最適で最も堅牢な手法はどれかわかりません.
グレースケールの高速カメラを使用して画像をキャプチャしていますが、任意の色/パターンのサッカー ボールを使用できるようにしたいと考えています。ボールは部分的に塞がれることもあります。
これらの手法が適切でないと思われる場合は、これを実現するためのアイデアや提案をお待ちしています。
事前にご協力いただきありがとうございます。
opencv - Haar Like Feature 式について
Haar-Like Feature 方程式を知りたいです。これにより、エッジ フィーチャ、ライン フィーチャ、およびセンター サラウンド フィーチャを証明できます。
ベストサンク・チャラット(タイ)
adaboost - ブースティングの各ラウンドで、Viola-jones の顔検出方法で同じ Haar 特徴が選択されるとどうなりますか?
人間の顔を検出するために Viola-Jones の顔検出を実装しています。Adaboost を使用してトレーニングしている間、ブースト ラウンドは同じ haar 機能を選択します。たとえば(x,y,w,h,f,p)
、最初の 3 ラウンドで選択された Haar-feature が(0,0,4,2,1,0)
で(1,3,5,2,3,1)
、(2,4,7,2,4,1)
残りのブースト ラウンドで同じ haar-feature が選択された場合、選択した Haar-feature のリストは次のようになります。
[(0,0,4,2,1,0),(1,3,5,2,3,1),(2,4,7,2,4,1),(1,2,4,8,1,0),(1,2,4,8,1,0),(1,2,4,8,1,0),(1,2,4,8,1,0),(1,2,4,8,1,0)]
.
ここ、
x,y = x_y coordinate, w = width of Haar-feature, h = height of Haar-feature, f = feature type, p = parity of Haar-feature.
私の質問:
1) ブースティングの各ラウンドで同じ Haar 特徴が選択される場合、比較的誤差が最小の次の Haar 特徴を選択する必要があります。
ありがとう!
c++ - Haar Cascade 分類中にポジティブを表示する方法
皆さん、私は Opencv で独自の分類器をトレーニングしましたが、それを実行すると、悪い結果が得られます。私の目標は、Haar 機能をガイドラインとして使用することなので、カスケード分類器全体が実行された後ではなく、すべての機能の後、各ステップでポジティブを表示したいと思います。その場合、検出器にその機能で停止するように指示することは可能ですか、それとも機能のしきい値を含む xml ファイルを手動で切り詰める必要がありますか? ありがとうございました
c++ - openCV でのウェーブレット変換
誰かが opencv または C++ で DWT を実装しようとしましたか? このテーマに関する古い投稿を見ましたが、ウェーブレット変換の結果として近似係数と詳細が必要なため、役に立ちませんでした。
これをプロジェクトに追加しようとしましたが、計画どおりに機能していません。
結果として、パラメータとして近似係数と詳細が必要になるため、これは単純です。
それで、誰かがC ++で実装されたdwtを見つけるのを手伝ってくれたり、上記のコード係数から抽出する方法を教えてくれませんか. ありがとう