「GPU のメモリ バウンド カーネルとコンピューティング バウンド カーネル」とは何ですか?
これは GPU のパフォーマンスに関連していますか?
非公式には、カーネル時間のほとんどがメモリ命令の実行に費やされている場合、カーネルはメモリにバインドされています。対照的に、ほとんどの操作がALU-FPU命令である場合、カーネルは計算にバインドされます。GPUは高いメモリと計算帯域幅を備えており、両方のカテゴリに適しています。これらの用語は、分類と、アプリケーションのパフォーマンスを大幅に向上させる可能性のある最適化手法を示すために使用されます。
各カテゴリのワークロードには、さまざまな最適化のヒントがあります。
たとえば、メモリバウンドワークロードの場合:
コンピューティングバウンドワークロードの場合: