問題タブ [cudpp]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
292 参照

cuda - CUDPPHandle 使用時のエラー

私は初心者としてCUDAに取り組んでおり、CUDPHandleを使用するたびにコンパイルでエラーが発生する事前に作成されたコードを実行しようとしています...たとえば

最後の行に次のエラーが表示されます。

  1. タイプ「CUDPPHandle *」の引数は、タイプ「CUDPPHandle」のパラメータと互換性がありません
  2. 「CUDPPConfiguration」から「CUDPPHandle *」への適切な変換関数が存在しない
  3. 「int」から「CUDPPConfiguration」に変換するための適切なコンストラクターが存在しません
  4. 関数呼び出しの引数が少なすぎる

私は 'nvcc -arch sm_20' を使用して tesla C2075 でコンパイルしています。

0 投票する
0 に答える
202 参照

sorting - K10 GPU での基数ソートのパフォーマンス

大規模な配列 (数百 M 要素) の GPU での並べ替えアルゴリズムの高速な実装を探しています。私はすでに cudpp を試しましたが、1 秒あたり 450M から 500M の 4 バイト キー + 4 バイト フィールドを取得しました。それは悪くはありませんでしたが、それでも CPU ができることの範囲内です。それから私はこれに出くわしました: https://code.google.com/p/back40computing/wiki/RadixSortingGTX480 で 700M キー + 値/秒を要求します。私は言った-うわー!- 私はテスラ K10 を使っているので、より強力なハードウェアを試してみる必要があります! コードを取得し、nvidia 機能 30 用にコンパイルし、試してみました...cudpp コードとほぼ同じ数値が得られます。さらに掘り下げると、cudpp は Thrust の基数ソートを使用しているように見え、bc40 アルゴリズムが Thrust に組み込まれているため、全体として同じコードを実行している可能性があります。bc40 コードでいくつかのパラメーター (ブロック サイズ、グリッド サイズなど) を試してみましたが、事態を悪化させるだけでした。ここに質問があります - 別の (より強力な) GPU で cudpp 基数ソートまたは bc40 基数ソートをテストした人はいますか? 700M/秒のキーと値の近くですか? 押す魔法のボタンはありますか?nsight プロファイラーは、GPU 使用量の悲惨な 25% を報告します (ボトルネックとしての共有メモリ アクセス)。

0 投票する
1 に答える
180 参照

cuda - libcudpp.so は CUDA 7.0 にありませんか?

私はjCudaを使用しており、CUDA 7.0を搭載したUbuntu 14.04のjcudaで利用可能なその例の1つ(JCudppHashSample)をコンパイルして実行しようとしました。

しかし、コンパイル時に、ライブラリ jcudpp は利用可能な libcudpp がないと言っています。そして、それがcuda sdkにないのかどうか疑問に思っていますか?

ソースを入手して手動で作成するという考えは好きではありません。