1

NVIDIA GPU で opencl プログラムを PTX レベルでインターセプトしたい。

ルーチンはおそらくこのようになると思います。

まず、NVIDIA コンパイラを使用して、opencl プログラム (ホスト コードとデバイス コードの両方) を作成し、それぞれの ptx コードを生成します。次に、PTX コードを変更して、やりたいことを書きます (デバイスの C コードでこれを行わなかった理由を聞かないでください。いくつかの理由があります)。しかし問題は、変更後、この PTX コードをバイナリ コードにコンパイルするにはどうすればよいかということです。

4

1 に答える 1

1

CUDA ツールキットに含まれている ptxas を使用できます。.ptx を .cubin にコンパイルし、ドライバー API で読み込むことができます。

于 2012-07-10T03:41:38.827 に答える