問題タブ [haar-wavelet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
xml - ジェスチャ認識用の Haar トレーニング済みデータセット - カウント
手指を使用してカウントを実行するために使用される HAAR トレーニング済みデータ セット (OpenCV/C++) を見つけようとしています。手認識用の訓練されたデータセットはたくさん見つかりましたが、今のところ指のカウント用ではありません。よく知られているリソースはありますか?
リンクは大歓迎です。ありがとう!
image-processing - ハールウェーブレット変換
画像のハール変換を計算する関数があります。ここで、画像のピクセル値を計算のためにhaar関数に直接渡します。LLサブバンドで元の画像を取り戻せません。何が悪いのか助けてください。ハール変換の計算が正しいと確信しています。しかし、どの値を渡すかはわかりません。助けてください
java - 負の値をRGBコンポーネントにマップする方法は?
色付きの画像にハール変換を適用したい。このためには、赤、緑、青のコンポーネントに別々に haar 関数を適用する必要があります。私の理解によると、ハール関数は平均化と差分です。そのため、赤、青、緑のコンポーネントの値が負になる場合があります (差分の実行中)。負の値を取得すると、r/g/b コンポーネントにマップできません。この問題を解決する方法。Javaでhaar関数を実装しています。また、harr 変換を計算するためにライブラリを使用していません。助けてください。
steganography - LSB 置換ステガノグラフィで DWT を使用する方法
ステガノグラフィでは、最下位ビット (LSB) 置換法により、画像ピクセルなどのカバー メディアからのビットの代わりに秘密ビットが埋め込まれます。一部の方法では、画像の離散ウェーブレット変換(DWT) が行われ、秘密ビットが DWT 係数に埋め込まれます。その後、逆変換を使用してステゴ画像が再構築されます。
ただし、DWT は float 係数を生成し、LSB 置換法には整数値が必要です。私が読んだほとんどの論文は 2D Haar Wavelet を使用していますが、その方法論は明確ではありません。ローパスフィルターとハイパスフィルター(フロート変換)、またはペア値の合計と差、または平均と平均差などの観点から変換が定義されているのを見てきました。
より明示的には、順変換または逆変換のいずれかで (ただし、使用される式によっては必ずしも両方であるとは限りません)、最終的に浮動小数点数が表示されます。置換が機能しないため、係数用にそれらを使用することはできません。また、画像はストレージに整数値を必要とするため、再構成されたピクセル用にそれらを使用することもできません。
たとえば、ピクセルのペアを 1D 配列として考えてみましょA
うB
。低周波係数は和、つまり で定義され、高周波係数はs = A + B
差、つまり で定義されd = A - B
ます。B = (s - d) / 2
次に、とを使用して元のピクセルを再構築できA = s - B
ます。ただし、係数を少しいじった後は、s - d
もはや偶数ではない可能性があり、再構成されたピクセルに対して float 値が出現します。
2D の場合、1D 変換は行と列に別々に適用されるため、最終的にどこかで 4 による除算が発生します。これにより、浮動小数点の剰余が .00、.25、.50、および .75 の値になる可能性があります。私は、この問題を扱っている論文を 1 つだけ見つけました。残りの方法論は非常に曖昧であり、私はそれらを再現するのに苦労しています. しかし、DWT はイメージ ステガノグラフィのために広く実装されています。
私の質問は、私が読んだ文献のいくつかは啓発的ではなかったので、どうしてこれが可能になるのでしょうか? float 値を導入する変換をどのように使用できますか?
c++ - C/C++ Wavelet ライブラリ、非 GPL
理想的には、GSL のような複数のウェーブレット カテゴリへのシンプルで直接的なインターフェイスを備えたものを見つけたいと考えていますが、これには独自のソフトウェアで使用できるライセンスがあります。ここでの一番の回答には 10 個の Wavelet ライブラリがリストされていますが、1つを除いてすべて GPL の下でライセンスされています。 )。とにかく選択肢を増やしたい。
これもクールに見えますが、cuda対応のGPUを前提としており、それを想定することはできません。
image-processing - 画像の逆定常ウェーブレット変換を計算するには?
順定常ウェーブレット変換と、それが対角線、垂直線、および水平線のコンポーネントにどのように実装されるかを理解しています。実際、私はそれを実装しました。私が理解していないのは、垂直、対角、および水平成分が与えられた画像の逆定常ウェーブレット変換を計算するアルゴリズムは正確には何ですか? アルゴリズムの簡単な説明を見つけることができませんでした。誰かが助けてくれればありがたいです.
java - 目と口の角のポイントを使用した OpenCV による顔の特徴の検出
私は顔の特徴検出プロジェクトに取り組んでおり、Haarcascade xml ファイルを使用して OpenCv を使用して目、鼻、口を検出しています。でも、目尻と口角のポイントと鼻の中心が欲しいです。目標は、それを使用して感情を予測することです。このリンクがどのように機能するかを示しています。JAVA を使用してこの結果を取得する必要があります。誰でも私を助けることができますか?
前もって感謝します。
http://cmp.felk.cvut.cz/~uricamic/flandmark/
この部分では、顔の画像を受け取り、顔に drawRect を実行します。
opencv - Haar カスケードの画像サイズに関する考慮事項
OpenCV Haar カスケード分類器は、正のトレーニング データとして顔の 24x24 画像を使用しているようです。これに関して 2 つの質問があります。
- より大きなトレーニング画像はより多くの処理を必要とするという事実以外に、トレーニング画像のサイズを選択する際の考慮事項は何ですか?
- 正方形でない画像の場合、一方のサイズを 24 ピクセルに保ち、必要に応じてもう一方のサイズを拡大することを選択した人もいます (たとえば、100 ~ 200 ピクセル)。これは正しい戦略ですか?
- トレーニング画像のサイズを決定するにはどうすればよいですか (これは質問 1 の変形です)
matlab - Matlab Haar ウェーブレット
私のタスク
1. [1][-1] のような haar フィルタがあります
2. 次のような画像があります
- [a][b][c][d]
- - [e][f][g ][h]
3. 画像に対してウェーブレット変換を実行し、次の結果を得たいと考えています。
- - ステップ 1:
- - - [mean(a,b)][mean(c,d)][ab][ cd]
- - - [mean(e,f)][mean(g,h)][ef][gh]
- - 名前の変更: --- わかりやすく表示するためだけに
- - - [a'][b'] [c'][d']
- - - [e'][f'][g'][h']
- - ステップ 2:
- - - [平均(a',b')][a'-b '][c'][d']
- - - [mean(e',f')][e'-f'][g'][h']
4. ステップ 2 の結果は、私が望むものです。
質問
ウェーブレット アプリケーションに関するツールボックスが Matlab にあることがわかりました。
このコマンドを使用しました [cA,cH,cV,cD] = dwt2(I,'haar'); 出力 cV は近いですが、私が望むものではありません。
そのため、Matlab で自分のタスクを簡単な方法で実行するにはどうすればよいかをお尋ねしたいと思います。つまり、このタスクを実行するためにいくつかの組み込みツールを使用できるということです。
私のやり方
これは私がやっていることですが、もっと簡単な方法はありますか?