問題タブ [numba-pro]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
android - Jetson TK1 で Numbapro を使用する
これについてインターネット全体を検索しましたが、信頼できる答えが見つかりませんでした。私は GPU プログラミングの初心者ですが、シミュレーションと Python が大好きなので、Jetson TK1 ユニットを注文しました。PC で Numpy を試しましたが、これらのシミュレーションを Android に持ち込みたいです。PyCuda と Numba について読んだことがありますが、完全に Python で書かれているため、C でカーネルを記述する必要がないため、後者を好みます。 ) Tegra K1 SOC のマルチコア ARM CPU にコードを向けることができ、CUDA 6 で利用可能なユニファイド メモリをどのように使用できるようになりますか。注意してください、Numba はまだ ARM LLVM をサポートしていません。または、CPU コア/スレッドにアクセスできるように、必須の C++ および CUDA C++ クラスを開始する必要がありますか。
python - Autojit - 回転のパフォーマンスを向上させる方法
次のコードがあります。
私はそれをテストしていますが、1.7300620079
数秒かかります。しかし、@autojit
デコレータを使用すると悪化します。
秒1.92721390724
で。より良いパフォーマンスを得るために何かを変更する必要がありますか?
テスト用のコードは次のとおりです。
python - python numbaproの実行時のCudaリソース不足エラー
numbapro python で cuda カーネルを実行しようとしていますが、リソース不足エラーが発生し続けます。次に、カーネルをループして実行し、より小さい配列を送信しようとしましたが、それでも同じエラーが発生しました。
これが私のエラーメッセージです:
ここに私のソースコードがあります:
python - GPUのスレッドレジスタに配列を定義するNumbapro cuda python
np.array
または またはnp.zeros
またはnp.empty(shape, dtype)
を使用してホスト内にグローバル デバイス関数を作成し、コピーする方法を知ってcuda.to_device
います。
また、共有配列を次のように宣言することもできますcuda.shared.array(shape, dtype)
しかし、gpu関数内の特定のスレッドのレジスタに一定サイズの配列を作成する方法.
試してみcuda.device_array
ましnp.array
たが、何も機能しませんでした。
私は単にスレッド内でこれをやりたい -
python - numbapro が GPU で動作しなくなった
次のプログラムを実行しようとしています。
初めて実行したときはうまくいきました。しかし、その後、nvprof といくつかの追加ライブラリをインストールしようとしましたが、それ以降、次のエラーが発生します。
ライブラリをアンインストールしても解決しませんでした。