16 コアのマシンと、途方もない並列プログラムがあるとします。私は多数の numpy ドット積と numpy 配列の追加を使用しています。マルチプロセッシングを使用していなければ、それは簡単なことです。numpy が、マルチスレッドを使用する blas のバージョンに対してビルドされていることを確認してください。しかし、私はマルチプロセッシングを使用しており、すべてのコアが常に一生懸命働いています。この場合、マルチスレッド blas を使用するメリットはありますか?
ほとんどの操作は (blas) タイプ 1 で、一部はタイプ 2 です。