問題タブ [numba-pro]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cuda - NumaPro Cuda デバイス関数 - 複数の配列とローカル メモリを返す
複数の配列を返すデバイス関数を書きたい場合、cuda.jit デコレータの正しい構文を知っている人はいますか?
デバイス関数が 1 つの float を返し、2 つの整数パラメーターを持つ場合、デコレーターは次のようになります。
ここで、関数が 2 つの整数パラメーターと 2 つの浮動小数点数を取り、2 つの浮動小数点数の配列と 2 つの整数の配列を返します。これらはすべて同じ長さ (3 から 5 の間) で、入力引数に依存します。それ、どうやったら出来るの?それは正しいでしょうか:
また、私の関数では、次を使用して、返したい配列を作成します。cuda.local.array()
inline=True を使用しているので、これが機能し、配列はそれぞれのスレッドによってのみアクセス可能になると思われますよね?
python - CUDA/Python: 行列演算の変換エラー
NumbaPro CUDA Python を使用して、マトリックスで非常に基本的な近隣アルゴリズムを実行しようとしています。
関数:
関数の入力は 2D 配列 (256x256) です。
ターゲットが CPU の場合、このコードは問題なく実行されますが、GPU の場合は次のエラーが発生します。
このエラーについては何も見つかりません。誰が何が間違っているのか、何が問題なのか知っていますか?
EDIT : エラーはreturn
ステートメントが原因です。修正を削除return
すると、コードが修正されます。
python - Numbapro は SIMD プログラミング アーキテクチャをサポートしていますか?
シンプレックス最適化を使用して GPU のエントロピー問題を解決しようとしています。シンプレックスの各反復は前の反復に依存しているため、アルゴリズムを並列化する方法はないと思います。
ただし、PyOpenCl と Numbapro について調査した結果、OpenCl は SIMD と呼ばれるプログラミング アーキテクチャのタイプを提供します。Numbaproが同じものを提供するかどうか疑問に思いましたか?
これまでのところ、コードの一部で jit、autojit、および vectorize を試しましたが、パフォーマンスが向上する兆候はありませんでした。
python - CUDA を python 3.5 と numba で動作させる方法
コードを実行することにより:
エラーが発生します:
numba 内で CUDA を有効にするにはどうすればよいですか? 最近、CUDA ツールキット 7.5 と最新の numba と numpy を python 3.5 にインストールしました。
python - 関数名と引数の間の Python 角括弧: func[...](...)
このノートブックから GPU での Python 計算を高速化する方法を学んでいましたが、1 行で混乱します。
ここで、mandel_kernel
は (によってcuda.jit
) 装飾された関数でgriddim
ありblockdim
、長さ 2 のタプルです: griddim=(32,16)
, blockdim=(32,8)
.
cuda.jit
関数名と引数リストの間のこの角括弧は、Python 構文の一部ですか、それとも装飾に固有のものですか?