問題タブ [npp]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
559 参照

image-processing - NPP を使用したアンシャープ マスク

NPP を使用して「アンシャープ マスク」を作成しようとしましたが、画像がシャープにならず、一部の領域が少し明るくなりました。このコードの何が問題なのか分かりますか?

0 投票する
1 に答える
663 参照

c++ - CUDA NPP - 画像縮小 - すべての画像ピクセルの合計/平均を求める

nppiSum_8u64s_C1Rグレースケール (0 ~ 255 の値) の 8 ビット符号なし char 画像があり、すべてのピクセルの合計と平均を求めるために、などの関数を提供する NPP CUDA ライブラリ ドキュメントを使用したいと考えています。

しかし、関数で何oSizeROIを表しているのかわかりませんか?nppiSum_8u64s_C1Rここに画像のサイズを入力するだけでよいw256 x h1024ですか?

image_statistics__functions.html#gad5ca4eb684d5414e6026564ea63a1437">http://graphics.im.ntu.edu.tw/~bossliaw/nvCuda_doxygen/html/group_ image _statistics__functions.html#gad5ca4eb684d5414e6026564ea63a1437

0 投票する
1 に答える
1041 参照

c++ - CUDA NPP - GPU エラー チェック時の不明なエラー

画像内のすべてのピクセルを合計し、CUDA NPP ライブラリを使用してすべてのピクセルの平均を取得しようとしています。私の画像は8-bit unsigned char grayscale次元の画像ですw256 x h1024。ポインターを宣言し、対応する NPP 型のポインターを NPP 関数に渡すために必要なすべての規則に従うようにしました。

ただし、unknown errorコードで GPU エラー チェックを実行するとエラーが発生します。デバッグしようとしましたが、どこが間違っているのかわかりません。助けてください。

これに加えて OpenCV を使用して処理を行っているため、いくつかの OpenCV コードが存在します。

編集:コードが更新されました

0 投票する
1 に答える
603 参照

cuda - nppiCopyConstBorder_8u_C1R でのパフォーマンスの低下

nppiCopyConstBorder_8u_C1R異なる CUDA バージョン (それぞれ v5.0 と v5.5) を含む 2 つの異なるアーキテクチャ (GTX480 と GTX TITAN) で関数を使用すると、パフォーマンスが低下します。

最初のケース (GTX480 および CUDA 5.0) では、関数の実行時間は

2 番目のケース (GTX TITAN および CUDA 5.5) の実行時間は次のとおりです。

次のコードでこの動作を再現しました。

Q:この問題について知っている人はいますか?

これは私に次の質問をさせます:

Q:どのようにnppiCopyConstBorder_8u_C1R実装されていますか? この機能には、デバイスからホストへのデータのコピー、ホストでの境界の拡張、および結果のデバイスへのコピーが含まれますか?

PS: TITAN を搭載したマシンには、複数の PCIe 接続用に特別に設計された独立したマザーボードの箱の外側に GPU があり、PCIe ワイヤを介して接続されています。私がテストした他のカーネルに関して、この構成に欠点は見られませんでした。

0 投票する
3 に答える
911 参照

api - Npp8u * を CUdeviceptr に変換するにはどうすればよいですか

私は cuda ドライバー Api インターフェイスに不慣れですが、CUdeviceptr はハンドル パラメーターのように見えると思います。

上記のような変換を書いてみましたが、そうですか!

0 投票する
1 に答える
364 参照

cuda - CUDA - (位置合わせされていない) サブイメージ (テクスチャ バインディング、NPP など) を操作する際に問題はありますか?

CPU では、2-D 画像 (ピッチリニア) の「サブ画像」をよく使用します。これは単に「マスター」画像の特定の ROI を指しています。そのため、サブイメージに対するすべての変更は、実際には「マスター」イメージも変更します。

サブイメージから 2D イメージ (ピッチリニア) への CUDA でデバイス メモリに問題はありますか? たとえば、テクスチャをテクスチャまたはテクスチャ オブジェクトにバインドできますか? NPP ルーチンは正しく機能していますか? 特定のルーチンで特定のアラインメント (バッファーの「開始アドレス」) が必要になる可能性があるなどの問題があるためです。

私は主に安定性の問題に関心があることに注意してください。これらのサブイメージにはわずかなパフォーマンスのペナルティがあると思いますが、それは私の主な関心事ではありません。

特に、「cudaBindTexture2D」のドキュメントに記載されているバッファ ベース アドレスのアラインメント制限に興味があります

「ハードウェアがテクスチャ ベース アドレスにアライメント要件を適用するため、cudaBindTexture2D() は *offset で、目的のメモリから読み取るためにテクスチャ フェッチに適用する必要があるバイト オフセットを返します。」

「テクスチャ オブジェクト」にも必要です (CC >= 3.0 GPU の場合) ?