問題タブ [numba]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
2325 参照

python - 4 コアのハイパースレッド CPU で 8 スレッドを使用すると、4 スレッドよりも高速になるのはなぜですか?

クアッドコア i7 920 CPU を使用しています。ハイパースレッド化されているため、コンピューターは 8 つのコアがあると認識します。

インターウェブで読んだことによると、並列タスクを実行するときは、ハイパー スレッド コアの数ではなく、物理コアの数を使用する必要があります。

そのため、いくつかのタイミングを行ったところ、並列ループで 8 スレッドを使用する方が 4 スレッドを使用するよりも高速であることに驚きました。

どうしてこれなの?サンプル コードは長すぎてここに投稿できませんが、ここでサンプルを実行すると見つけることができます: https://github.com/jsphon/MTVectorizer

パフォーマンスのグラフは次のとおりです。

ここに画像の説明を入力

0 投票する
1 に答える
526 参照

python - GPUのスレッドレジスタに配列を定義するNumbapro cuda python

np.arrayまたは またはnp.zerosまたはnp.empty(shape, dtype)を使用してホスト内にグローバル デバイス関数を作成し、コピーする方法を知ってcuda.to_deviceいます。

また、共有配列を次のように宣言することもできますcuda.shared.array(shape, dtype)

しかし、gpu関数内の特定のスレッドのレジスタに一定サイズの配列を作成する方法.

試してみcuda.device_arrayましnp.arrayたが、何も機能しませんでした。

私は単にスレッド内でこれをやりたい -

0 投票する
1 に答える
530 参照

python - jit を使用して numba 関数に正しくアノテーションを付ける

このコードから始めて、単純な行列の乗算を計算しました。私のマシンでは約7.85秒で%timeitで実行されます。

これを高速化するために、時間を 0.4 秒に短縮した cython を試しました。また、numba jit コンパイラーを使用して、(より少ない労力で) 同様の速度向上が得られるかどうかを確認したいと考えています。しかし、@jit アノテーションを追加すると、まったく同じタイミング (~7.8 秒) が得られるようです。calculate_z_numpy() 呼び出しのタイプを理解できないことはわかっていますが、それを強制するために何ができるかわかりません。何か案は?

0 投票する
0 に答える
55 参照

multithreading - このマルチスレッド スクリプトがフリーズするのはなぜですか?

ここで最後の例を変更しようとしています:

http://numba.pydata.org/numba-doc/0.15.1/examples.html

マルチスレッドの groupby-max 関数を実装する。

私がこれまでに行ったことは以下のとおりです。IPythonセッションでは、「メインスレッドで」印刷することになりますが、その後、新しいコマンドを入力しようとすると、コンソールは「Console already exited with value: -1073741819 while waiting for an answer.」と出力するだけです。

スレッドを正しく機能させるにはどうすればよいですか?

ナンバーがあります。バージョン0.15.1。

0 投票する
2 に答える
1827 参照

python - numbapro が GPU で動作しなくなった

次のプログラムを実行しようとしています。

初めて実行したときはうまくいきました。しかし、その後、nvprof といくつかの追加ライブラリをインストールしようとしましたが、それ以降、次のエラーが発生します。

ライブラリをアンインストールしても解決しませんでした。

0 投票する
2 に答える
257 参照

python - メモリ制限のある合計の二乗を合計する方法は?

これは、この質問のフォローアップです。

和の和の二乗和の和をどのように行うのですか?

einsum を使用して (大幅な速度向上を達成するために) 助けを求めていたところ、すばらしい答えが得られました。

また、使用するための提案も得ましたnumba。私は行って両方を試してみましたが、ある時点以降は速度の増加numbaがはるかに優れているようです.

では、メモリの問題を起こさずに高速化するにはどうすればよいでしょうか?

0 投票する
1 に答える
9115 参照

python - numba の jit と autojit の違いは何ですか?

jitとの違いが何なのか混乱していautojitます。

私はこれを読みました:

http://numba.pydata.org/numba-doc/0.6/doc/userguide.html

しかし、2 つのオプションのどちらかを選択する自信があるとは言えません。理想的には例を挙げて、誰かが詳しく説明できますか。

ありがとうございました

0 投票する
0 に答える
304 参照

python - ctypes を使用して numba export で作成された共有ライブラリをインポートする方法は?

この例に従ってみました

http://numba.pydata.org/numba-doc/dev/pycc.html

私のコードのコンパイル済みバージョンを取得します。

しかし、私はそれをロードする方法がわかりません。これまでに試したことは次のとおりです。

test3.py:

コマンドラインで:

ipython コンソールで:

これは私にエラーを与えます....

これは問題ではなく、ctypes+の使い方を知らないということだと思います。どんな助けでも感謝します。pyccnumba