GTX 650 で実行されている CUDA rodinia ベンチマークのプロファイルを作成しようとしています。コード /usr/local/cuda-5.0/extras/CUPTI/samples/event_sampling を使用して、命令実行カウンターを読み取ります。CUDA ベンチマークを実行しているかどうかに関係なく、event_sampling によって報告される値に変化が見られないのは奇妙に思えます。
event_sampling コードには、実行された命令を測定するための独自の計算もあります。CPU とは異なり、instruction_executed などの GPU カウンターを読み取れるようにするには、アプリケーションのソース コードを変更する必要がありますか?