問題タブ [npp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
image-processing - NPP を使用したアンシャープ マスク
NPP を使用して「アンシャープ マスク」を作成しようとしましたが、画像がシャープにならず、一部の領域が少し明るくなりました。このコードの何が問題なのか分かりますか?
c++ - CUDA NPP - 画像縮小 - すべての画像ピクセルの合計/平均を求める
nppiSum_8u64s_C1R
グレースケール (0 ~ 255 の値) の 8 ビット符号なし char 画像があり、すべてのピクセルの合計と平均を求めるために、などの関数を提供する NPP CUDA ライブラリ ドキュメントを使用したいと考えています。
しかし、関数で何oSizeROI
を表しているのかわかりませんか?nppiSum_8u64s_C1R
ここに画像のサイズを入力するだけでよいw256 x h1024
ですか?
image_statistics__functions.html#gad5ca4eb684d5414e6026564ea63a1437">http://graphics.im.ntu.edu.tw/~bossliaw/nvCuda_doxygen/html/group_ image _statistics__functions.html#gad5ca4eb684d5414e6026564ea63a1437
c++ - CUDA NPP - GPU エラー チェック時の不明なエラー
画像内のすべてのピクセルを合計し、CUDA NPP ライブラリを使用してすべてのピクセルの平均を取得しようとしています。私の画像は8-bit unsigned char grayscale
次元の画像ですw256 x h1024
。ポインターを宣言し、対応する NPP 型のポインターを NPP 関数に渡すために必要なすべての規則に従うようにしました。
ただし、unknown error
コードで GPU エラー チェックを実行するとエラーが発生します。デバッグしようとしましたが、どこが間違っているのかわかりません。助けてください。
これに加えて OpenCV を使用して処理を行っているため、いくつかの OpenCV コードが存在します。
編集:コードが更新されました
cuda - nppiCopyConstBorder_8u_C1R でのパフォーマンスの低下
nppiCopyConstBorder_8u_C1R
異なる CUDA バージョン (それぞれ v5.0 と v5.5) を含む 2 つの異なるアーキテクチャ (GTX480 と GTX TITAN) で関数を使用すると、パフォーマンスが低下します。
最初のケース (GTX480 および CUDA 5.0) では、関数の実行時間は
2 番目のケース (GTX TITAN および CUDA 5.5) の実行時間は次のとおりです。
次のコードでこの動作を再現しました。
Q:この問題について知っている人はいますか?
これは私に次の質問をさせます:
Q:どのようにnppiCopyConstBorder_8u_C1R
実装されていますか? この機能には、デバイスからホストへのデータのコピー、ホストでの境界の拡張、および結果のデバイスへのコピーが含まれますか?
PS: TITAN を搭載したマシンには、複数の PCIe 接続用に特別に設計された独立したマザーボードの箱の外側に GPU があり、PCIe ワイヤを介して接続されています。私がテストした他のカーネルに関して、この構成に欠点は見られませんでした。
api - Npp8u * を CUdeviceptr に変換するにはどうすればよいですか
私は cuda ドライバー Api インターフェイスに不慣れですが、CUdeviceptr はハンドル パラメーターのように見えると思います。
上記のような変換を書いてみましたが、そうですか!
cuda - CUDA - (位置合わせされていない) サブイメージ (テクスチャ バインディング、NPP など) を操作する際に問題はありますか?
CPU では、2-D 画像 (ピッチリニア) の「サブ画像」をよく使用します。これは単に「マスター」画像の特定の ROI を指しています。そのため、サブイメージに対するすべての変更は、実際には「マスター」イメージも変更します。
サブイメージから 2D イメージ (ピッチリニア) への CUDA でデバイス メモリに問題はありますか? たとえば、テクスチャをテクスチャまたはテクスチャ オブジェクトにバインドできますか? NPP ルーチンは正しく機能していますか? 特定のルーチンで特定のアラインメント (バッファーの「開始アドレス」) が必要になる可能性があるなどの問題があるためです。
私は主に安定性の問題に関心があることに注意してください。これらのサブイメージにはわずかなパフォーマンスのペナルティがあると思いますが、それは私の主な関心事ではありません。
特に、「cudaBindTexture2D」のドキュメントに記載されているバッファ ベース アドレスのアラインメント制限に興味があります。
「ハードウェアがテクスチャ ベース アドレスにアライメント要件を適用するため、cudaBindTexture2D() は *offset で、目的のメモリから読み取るためにテクスチャ フェッチに適用する必要があるバイト オフセットを返します。」
「テクスチャ オブジェクト」にも必要です (CC >= 3.0 GPU の場合) ?