問題タブ [npp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cuda - NPP 画像相互相関が有効な結果を生成しない
NPP相互相関ライブラリを使用して画像変位法を実装しようとしています。
Npp8uまたはNpp32f配列のいずれかを出力して、メモリ内にいくつかの単純な画像を生成することにより、単純なソリューションを作成しようとしました。ただし、相互相関ライブラリは意味のない、または無効な (つまり、NAN) 結果を生成します。
CUDA メソッドと NPP メソッドの両方が成功メッセージを返しているので、相互相関の設定に問題があると確信しています。解決のために正しい方向に私を押し進めるのを手伝ってくれる人はいますか?
cuda - CUDA npp で複数のストリームを使用する
画像を並行して回転させるコードを作成したいと思います。
まず、nppiRotate_8u_C1R を使用してデフォルトのストリーム バージョンでコードが正常に動作することを確認し、4 ストリーム バージョンに変更しています。32 個の画像が 4 つのストリームにコピーされ、nppiRotate_8u_C1R_Ctx を使用して回転されます。
入力画像のサイズは 2048*2048 ですが、結果の画像はデフォルトのストリーム バージョンとは異なり、奇妙に見えます。
Nsight システムで両方のコードをプロファイリングしたところ、カーネルの起動構成が互いに異なっていることがわかりました。
デフォルトのストリーム バージョンでは、スレッド数はピクセル数と同じです (左)。
ただし、スレッドの数は 128128 で、入力画像のサイズ (右) よりはるかに少ないです。
回転した画像は 128128 左上の領域にのみ表示されます。
どうすれば解決できますか?または、私と同じ問題を経験した人はいますか?
OS : Windows 10
GPU : RTX 3090
CUDA バージョン : 11.1