問題タブ [haar-wavelet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - Haar ウェーブレットを使用して画像上の LINES を検出するには?
だから私はこのようなイメージを持っています:
私はこのようなものを手に入れたいです(私が望むすべての線を描いたわけではありませんが、あなたが私の考えを理解できることを願っています):
SURF ( (Speeded Up Robust Features) は堅牢な画像記述子であり、2006 年にHerbert Bay らによって最初に提示されたものです) または 2D Haar ウェーブレット応答の合計に基づいており、積分画像を効率的に使用するものを使用したいと考えています。画像上のすべての直線を見つけます。線の始点と終点の画像ピクセル座標に相対的に取得したい。
この図で、タイル間のすべての線と上の 2 つの黒い線を見つけます。
開始するコード例 (行検索機能付き) はありますか?
私は C と C++ が大好きですが、他の読み取り可能なコードはおそらく私に適しています =)
image - ハールのピラミッドとは?
私はこの論文の作業 (の一部) を再現しようとしています: http://www.mit.edu/~kimo/publications/harmonization/
「ハールのピラミッド」の意味がよくわかりません。ガウスとラプラシアンの画像ピラミッド、およびハール フィルターであらゆる種類のものを見つけましたが、「ハール ピラミッド」と呼ばれるものは (この論文以外では) どこにも見つかりませんでした。
現時点では、このページの下部にリンクされている 2D Haar 変換を大まかに使用しています (独自の画像形式で動作するように少し編集しています): http://www.cs.ucf.edu/~mali/haar/
これが与えられたとき:
それはこれを生成します:
これは私が探しているものですか?この形式で画像を処理することにどのような利点があるのか 理解できません。また、この論文では、「オーバーサンプリングされた」Haar ピラミッドを使用していると述べています。これは、フィルターを通過するたびに画像のサイズを変更していないことを意味すると私は信じています。その場合、これらの画像をすべてコンパクトに保存するにはどうすればよいですか? 私が持っているコードが気に入っているのは、すべてを 1 つのビットマップに格納するためであり、画像の複数のインスタンスの配列を格納する必要があるという考えはあまり魅力的ではありません。
私の質問のどの部分についても、少しでも洞察をいただければ幸いです。ありがとう!
python - CDF 9/7 離散ウェーブレット変換 (畳み込み)
CDF 9/7ウェーブレットを使用して、1Dリストで単一レベルの離散ウェーブレット変換を実行し、それを再構築する単純な自己完結型プログラムを作成しようとしています。畳み込み/フィルターバンク法を使用して、それがどのように機能するかを把握しています。言い換えると、リストをフィルターで畳み込み、スケール係数を取得し、リストを別のフィルターで畳み込み、ウェーブレット係数を取得しますが、これは他のすべての要素から開始するだけです。次に、アップサンプリング (つまり、要素間にゼロを追加) し、フィルタをウェーブレットに適用して係数をスケーリングし、それらを加算して、元のリストを取得します。
これを Haar ウェーブレット フィルターで機能させることはできますが、CDF 9/7 フィルターを使用しようとすると、同じ入力が生成されません。ただし、結果のリストと元のリストの合計は同じになります。
たたみ込みの非常にばかげたエラーだと確信していますが、それを理解することはできません。左端から開始するのではなく、インデックス「i」にフィルターを配置するなど、畳み込みの一連の順列を試しましたが、何も機能していないようです...おそらく、作成するバグの1つです私はそれを理解したときに頭を平手打ちします。
コードは次のとおりです。
ちなみに、ここの付録からフィルター値を取得しました:http://www1.cs.columbia.edu/~rso2102/AWR/Files/Overbeck2009AWR.pdf、しかし、私はそれらが一連のmatlabサンプルコードで次のように使用されているのを見てきました良い。
java - haar ウェーブレットを生成するには、画像のどの値を使用すればよいですか?
現在、画像内の各ピクセルの RGB 値を取得する Java プログラムがあります。また、値の 2 次元行列で Haar ウェーブレットを計算する方法もあります。しかし、Haar ウェーブレットを計算するメソッドにどの値を指定すればよいかわかりません。各ピクセルの RGB 値を平均し、その上で haar ウェーブレットを計算する必要がありますか? または、r、g、b のいずれかを使用することもできます。画像の一意のフィンガープリントを作成しようとしています。2 つのウェーブレットの内積をとって画像が互いにどの程度類似しているかを確認できるため、これは良い方法であると他の場所で読みました。
Haar ウェーブレットを計算する必要がある値を教えてください。ありがとうジェス
iphone - 人が笑っているときにwhitePixelValueを見つける方法は?
CvRectを使用して、顔の座標を検出できます
しかし、私の問題は、人が笑顔になったときにwhitePixelValueを見つける方法です。
そして、どのスマイルオフセットが適切ですか?150の値は正確ですか?
スマイルハーカスケードはまったく機能しません。白いピクセルだけでロジックを使って何かをする必要があります
助けてください!!!
更新:私の報奨金は無駄になると思います..このスレッドで専門家の反応は得られませんでした。私はアルゴリズムを探していました:(
opencv - Haar トレーニングと隠れマルコフ モデルを使用したハンド ジェスチャ認識
隠れマルコフ モデル (HMM) を使用した手のジェスチャー認識に関するプロジェクトを行っています。手の検出については、haar トレーニングと肌の色に基づく検出の 2 つの手法に絞り込みました。Haar トレーニングの方が有望に見えます。検出部分から始める方法を教えてください。左手の xml ファイルが既にあります。ありがとうございました
opencv - 顔検出におけるハールカスケードとLBPカスケード
私はOpenCV(Open Source Computer Vision Library)で顔検出を実験してきましたが、OpenCVで提供されている顔がいくつかあるため、Haarカスケードを使用して顔を検出できることがわかりました。ただし、LBPカスケードもいくつかあることに気づきました。調査を行った結果、LBPはLocal Binary Patternsの略であり、OpenCV顔検出ドキュメントによると顔検出にも使用できることがわかりました。
私が知りたいのは、どちらがうまくいくかということです。どちらがより速く実行され、どちらがより正確ですか?LBPのパフォーマンスは速いようですが、それについても100%確信はありません。ありがとう。
c++ - Haar 検出の改良
OpenCV と Haar cascade を使用して手検出プログラムを作成しようとしています。それは非常にうまく機能しますが、非常にぎくしゃくしています。だから私は、これが「安すぎる」Haarファイルのトラブルなのか、それとも輪郭や特徴検出(または他のテクニックかもしれない)を使って検出を改善する方法があるのか どうか自問しています.
私が実行したいのは、この顔検出と同じですが、手の場合:顔検出 (FaceOSC を参照)
どうもありがとう。
編集:ここに私がやりたいことがあります:手の抽出彼は輪郭検出でそれを実行しているようですが、どうやって手を見つけるのですか?
opencv - OpenCV の Haar カスケード分類子データ:
OpenCV で Haar 分類器のトレーニングに使用されるデータに関する情報が見つかりません。これらの分類子がどのような種類、数、どのように (手動またはプログラムを介して) 生成されたかを知りたいです。
これらの分類子の xml ファイルは、..OpenCV2.3.1\opencv\data\haarcascades..ディレクトリにあります。ありがとう
r - RでHaar関数をプロットする
次のように定義されているHaar関数をプロットしたいと思います。
次に、k番目のHaar関数は次のとおりです。
たとえば、描画したいh(t,1,1)
場合は、関数である必要があります。
では、Rのkとnが固定されたk番目の関数をどのようにプロットできますか?