4

さまざまな BLAS (Basic Linear Algebra Subprograms) ライブラリを比較するベンチマークはありますか? シングルコアおよびマルチコアシステムの疎行列乗算に特に興味がありますか?

4

1 に答える 1

6

BLASのパフォーマンスはシステムに大きく依存するため、使用するマシンでベンチマークを自分で行うのが最適です。BLASの実装はごくわずかであるため、思ったよりも作業が少なくて済みます(通常、ハードウェアベンダーの実装ATLASGOTO BLAS)。

ただし、BLASは密行列のみを対象としているため、疎行列の乗算にはSparse-BLASまたはその他のコードが必要になることに注意してください。ここでのパフォーマンスは、ハードウェアだけでなく、使用するスパース形式や、使用するマトリックスのタイプ(スパースパターン、帯域幅などが重要)によっても異なります。したがって、密集した場合よりもさらに、最大のパフォーマンスが必要な場合は、独自のベンチマークを実行する必要があります。

于 2008-12-31T16:05:35.030 に答える