22

Intel Math Kernel LibraryAMD Math Core Libraryの両方のプログラミング経験がある人はいますか? 高性能統計計算用のパーソナル コンピュータを構築しており、購入するコンポーネントについて議論しています。AMD Math Core ライブラリの魅力は無料であることですが、私は学界にいるので、MKL はそれほど高価ではありません。しかし、私は次のことについての考えを聞くことに興味があります:

  1. より優れた API を提供するのはどれですか?
  2. これにより、ライセンスとハードウェアのコストを含め、平均して 1 ドルあたりのパフォーマンスが向上します。
  3. AMCL -GPUは考慮すべき要素ですか?
4

3 に答える 3

12

Intel MKLとACMLのAPIは似ていますが、MKLには、BLAS(およびCBLAS)/ LAPACK / FFTs/VectorおよびStatisticalMath/スパース直接および反復ソルバー/スパースBLASなどの豊富なサポート機能があります。Intel MKLは、IntelプロセッサとAMDプロセッサの両方に最適化されており、ヘルプやガイダンスを求めることができるアクティブなユーザーフォーラムがあります。2つのライブラリの独立した評価はここに掲載されています:(http://www.advancedclustering.com/company-blog/high-performance-linpack-on-xeon-5500-v-opteron-2400.html

•ShaneCorder、Advanced Clustering、(HPCWireでも実行:ベンチマークチャレンジ:NehalemとIstanbul):「最近のテストと実際の経験から、IntelコンパイラとIntel Math Kernel Library(MKL)が通常最高のパフォーマンス。Intelのツールキットに固執する代わりに、Intel、GNUコンパイラ、PortlandGroupなどのさまざまなコンパイラを試しました。また、MKL、AMD Core Math Library(ACML)、テキサス大学のlibGOTOなどのさまざまな線形代数ライブラリもテストしました。すべてのテストで、IntelコンパイラとIntel Math Libraryの両方を使用した場合(AMDシステムでも)で最高のパフォーマンスを達成できることが示されたため、これらをベンチマークのベースとして使用しました。」[ベンチマークテストでは、74.0GFで4コアのNehalemX55502.66GHzと99.4GFでイスタンブール24352.6GHzが示されました。

お役に立てれば。

于 2009-10-30T23:36:30.980 に答える
3

実際、ACML には 2 つのバージョンの LAPACK ルーチンがあります。末尾にアンダースコア (_) がないものは C バージョンのルーチンで、Victor が言ったように、ワークスペース配列を必要とせず、パラメーターの参照の代わりに値を渡すことができます。ただし、アンダースコアが付いているものは、バニラの Fortran ルーチンです。libacml_dll.dll で「dumpbin /exports」を実行すると、表示されます。

于 2010-06-21T19:45:53.360 に答える
2

私は AMCL を BLAS/LAPACK ルーチンに使用したので、これはおそらくあなたの質問には答えられないでしょうが、誰かにとって役立つことを願っています。通常の BLAS/LAPACK と比較すると、私の特定のユース ケースではパフォーマンスが 2 ~ 3 倍優れていました。線形解法と固有系計算の両方で、密な非対称複素行列に使用しました。関数宣言は通常のルーチンと同じではないことに注意してください。この 2 つを自由に切り替えるには、かなりの量のプリプロセッサ マクロが必要でした。特に、AMCL のすべての LAPACK ルーチンは作業配列を必要としません。これは、使用するライブラリが AMCL だけである場合に非常に便利です。

于 2009-10-29T18:22:55.233 に答える