CUDA のデバイス カーネルからイベントを発生させる方法はありますか (CPU コードの cudaEvents に似た、ベンチマークの目的で)。
たとえば、カーネルの開始から計算を開始する最初のスレッドまでに経過した時間と、計算を終了した最後のスレッドから CPU が戻るまでに経過した時間を測定したいとします。
それをしてもいいですか?
CUDA のデバイス カーネルからイベントを発生させる方法はありますか (CPU コードの cudaEvents に似た、ベンチマークの目的で)。
たとえば、カーネルの開始から計算を開始する最初のスレッドまでに経過した時間と、計算を終了した最後のスレッドから CPU が戻るまでに経過した時間を測定したいとします。
それをしてもいいですか?
デバイス ランタイム API (動的並列処理で使用) では、ストリームとイベントのサポートが制限されていますが、イベントのタイミングはサポートされていません。
だから、いいえ、あなたはそれをすることはできません.