NVIDIA GPU で opencl プログラムを PTX レベルでインターセプトしたい。
ルーチンはおそらくこのようになると思います。
まず、NVIDIA コンパイラを使用して、opencl プログラム (ホスト コードとデバイス コードの両方) を作成し、それぞれの ptx コードを生成します。次に、PTX コードを変更して、やりたいことを書きます (デバイスの C コードでこれを行わなかった理由を聞かないでください。いくつかの理由があります)。しかし問題は、変更後、この PTX コードをバイナリ コードにコンパイルするにはどうすればよいかということです。