ROCm ソフトウェア スタックを使用して、Polaris20 GCN4th AMD GPU で OpenCL プログラムをコンパイルおよび実行していますが、GPU 上のどの計算ユニット (id) が現在のワークアイテムまたはウェーブフロントで現在使用されているかを調べる方法があるかどうか疑問に思っています。
つまり、カーネル内の計算を GPU 上の特定の計算ユニットまたは特定のハードウェアに関連付けることができるので、カーネルの実行中にハードウェアのどの部分が使用されているかを追跡できます。
ありがとうございました!