1

以前、関数 nvmlDeviceGetUtilizationRates() を使用して NVML を試しました。この方法でテストします。コレクションの実行中に、14 個の SM を持つ Tesla C2070 で DFT (カーネルは <7,32> として編成されます) を実行します。私の考えでは、GPU で 7 つのブロックが実行されました使用率は 50% のはずですが、API の結果は 99% でした。これは、GPU が完全に使用されていることを意味します。次に、NVML のドキュメントを読みました。 nvmlDeviceGetUtilizationRates() は、GPU で 1 つ以上のカーネルが実行されていた過去のサンプル期間の時間の割合のみを返すことができます。一部のカーネルが GPU で実行されているときにアクティブな SM 番号を取得するにはどうすればよいですか?

4

0 に答える 0