問題タブ [numba]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 4 コアのハイパースレッド CPU で 8 スレッドを使用すると、4 スレッドよりも高速になるのはなぜですか?
クアッドコア i7 920 CPU を使用しています。ハイパースレッド化されているため、コンピューターは 8 つのコアがあると認識します。
インターウェブで読んだことによると、並列タスクを実行するときは、ハイパー スレッド コアの数ではなく、物理コアの数を使用する必要があります。
そのため、いくつかのタイミングを行ったところ、並列ループで 8 スレッドを使用する方が 4 スレッドを使用するよりも高速であることに驚きました。
どうしてこれなの?サンプル コードは長すぎてここに投稿できませんが、ここでサンプルを実行すると見つけることができます: https://github.com/jsphon/MTVectorizer
パフォーマンスのグラフは次のとおりです。
python - GPUのスレッドレジスタに配列を定義するNumbapro cuda python
np.array
または またはnp.zeros
またはnp.empty(shape, dtype)
を使用してホスト内にグローバル デバイス関数を作成し、コピーする方法を知ってcuda.to_device
います。
また、共有配列を次のように宣言することもできますcuda.shared.array(shape, dtype)
しかし、gpu関数内の特定のスレッドのレジスタに一定サイズの配列を作成する方法.
試してみcuda.device_array
ましnp.array
たが、何も機能しませんでした。
私は単にスレッド内でこれをやりたい -
python - jit を使用して numba 関数に正しくアノテーションを付ける
このコードから始めて、単純な行列の乗算を計算しました。私のマシンでは約7.85秒で%timeitで実行されます。
これを高速化するために、時間を 0.4 秒に短縮した cython を試しました。また、numba jit コンパイラーを使用して、(より少ない労力で) 同様の速度向上が得られるかどうかを確認したいと考えています。しかし、@jit アノテーションを追加すると、まったく同じタイミング (~7.8 秒) が得られるようです。calculate_z_numpy() 呼び出しのタイプを理解できないことはわかっていますが、それを強制するために何ができるかわかりません。何か案は?
multithreading - このマルチスレッド スクリプトがフリーズするのはなぜですか?
ここで最後の例を変更しようとしています:
http://numba.pydata.org/numba-doc/0.15.1/examples.html
マルチスレッドの groupby-max 関数を実装する。
私がこれまでに行ったことは以下のとおりです。IPythonセッションでは、「メインスレッドで」印刷することになりますが、その後、新しいコマンドを入力しようとすると、コンソールは「Console already exited with value: -1073741819 while waiting for an answer.」と出力するだけです。
スレッドを正しく機能させるにはどうすればよいですか?
ナンバーがあります。バージョン0.15.1。
python - numbapro が GPU で動作しなくなった
次のプログラムを実行しようとしています。
初めて実行したときはうまくいきました。しかし、その後、nvprof といくつかの追加ライブラリをインストールしようとしましたが、それ以降、次のエラーが発生します。
ライブラリをアンインストールしても解決しませんでした。
python - メモリ制限のある合計の二乗を合計する方法は?
これは、この質問のフォローアップです。
einsum を使用して (大幅な速度向上を達成するために) 助けを求めていたところ、すばらしい答えが得られました。
また、使用するための提案も得ましたnumba
。私は行って両方を試してみましたが、ある時点以降は速度の増加numba
がはるかに優れているようです.
では、メモリの問題を起こさずに高速化するにはどうすればよいでしょうか?
python - numba の jit と autojit の違いは何ですか?
jit
との違いが何なのか混乱していautojit
ます。
私はこれを読みました:
http://numba.pydata.org/numba-doc/0.6/doc/userguide.html
しかし、2 つのオプションのどちらかを選択する自信があるとは言えません。理想的には例を挙げて、誰かが詳しく説明できますか。
ありがとうございました
python - ctypes を使用して numba export で作成された共有ライブラリをインポートする方法は?
この例に従ってみました
http://numba.pydata.org/numba-doc/dev/pycc.html
私のコードのコンパイル済みバージョンを取得します。
しかし、私はそれをロードする方法がわかりません。これまでに試したことは次のとおりです。
test3.py:
コマンドラインで:
ipython コンソールで:
これは私にエラーを与えます....
これは問題ではなく、ctypes
+の使い方を知らないということだと思います。どんな助けでも感謝します。pycc
numba