0

OpenCL への Python ラッパーと Pure C OpenCL の間のパフォーマンス測定を探しています。パフォーマンスの測定値は、時間、メモリなどによって変化する可能性があります。 - 利用可能なベンチマークはありますか? - タイム パフォーマンスの違いについて、どのようなことが予想されますか? - どのような種類のタスク (もちろん並行して...) が違いを生む必要がありますか?

4

3 に答える 3

3

ここにベンチマークがあります: https://github.com/bennylp/saxpy-benchmark、PyOpenCL を OpenCL と比較するだけでなく、CUDA、プレーン C++、Numpy、R、Octave、さらには TensorFlow (免責事項:筆者です)

ベンチマークの結果によると、OpenCL と PyOpenCL のパフォーマンスの違いは大きく異なります。PyOpenCL GPU ターゲットは OpenCL よりも約 7 倍遅いですが、CPU ターゲットでは、PyOpenCL は実際には OpenCL よりも 2 倍以上高速です!

于 2017-11-14T08:03:28.583 に答える