たとえば、nVidiaにはCUBLASがあり、7〜14倍の高速化が約束されています。素朴なことに、これはnVidiaのGPUカードの理論上のスループットにはほど遠いです。GPUで線形代数を高速化する際の課題は何ですか?また、より高速な線形代数ルーティングがすでに利用可能ですか?
1 に答える
0
私の知る限り、CUBLAS は Nvidia GPU で利用できる最速の線形代数の実装です。LAPACK 機能が必要な場合は、CULAPACKがあります。
CUBLAS は密な線形代数のみをカバーすることに注意してください。疎行列の場合は、CUSPARSE (CUDA ツールキットの一部としても提供されます) があります。
高速化は、操作しているデータの種類と、実行している特定の操作によって大きく異なります。線形代数演算には、非常にうまく並列化できるものと、本質的に逐次的であるため並列化できないものがあります。並列アーキテクチャの数値アルゴリズムの最適化は (そして何十年もの間) 継続的な研究分野であり、アルゴリズムのパフォーマンスは継続的に改善されています。
于 2012-09-04T21:50:58.580 に答える