CUDA が生成するコードの種類を確認するために、オブジェクト ファイルに加えて ptx にコンパイルするのが好きです。ループの展開にはかなりの時間がかかることがあるため、→ *.cu
< *.cu
code>*.ptxと*.cu
→< code>*.o、現在行っています。
行に追加-ptx
するだけnvcc *.cu
で、目的の ptx 出力が得られます。
を使用ptxas -c
してコンパイルする*.ptx
と*.o
動作しますが、実行可能リンクでエラーが発生します: Relocations in generic ELF (EM: 190)
.
*.ptx
withをコンパイルしようとすると、黙っnvcc
て失敗し、何も出力されません。
渡す必要があるオプションはありますptxas
か?別のコンパイルでptx経由で適切にコンパイルするにはどうすればよいですか? nvcc
または、 ptx を保持するように指示できますか?