5

「GPU のメモリ バウンド カーネルとコンピューティング バウンド カーネル」とは何ですか?

これは GPU のパフォーマンスに関連していますか?

4

1 に答える 1

5

非公式には、カーネル時間のほとんどがメモリ命令の実行に費やされている場合、カーネルはメモリにバインドされています。対照的に、ほとんどの操作がALU-FPU命令である場合、カーネルは計算にバインドされます。GPUは高いメモリと計算帯域幅を備えており、両方のカテゴリに適しています。これらの用語は、分類と、アプリケーションのパフォーマンスを大幅に向上させる可能性のある最適化手法を示すために使用されます。

各カテゴリのワークロードには、さまざまな最適化のヒントがあります。

たとえば、メモリバウンドワークロードの場合:

  • 共有メモリを活用する
  • メモリアクセスの合体
  • メモリーキャンプ。

コンピューティングバウンドワークロードの場合:

  • ブランチの分岐を減らす
  • ALU-FPUとSFU間のインターリーブ計算
  • ILPを活用するための十分な独立した指示を提供します。
于 2012-10-10T09:13:35.710 に答える