CUDA コードを含む Python スクリプトを実行するために、2 つの GPU を備えたリモート マシンを使用しています。コードのパフォーマンスを改善できる場所を見つけるために、 を使用しようとしていますnvprof
。
リモート マシンで 2 つの GPU の 1 つだけを使用するようにコードに設定しましたが、 を呼び出すnvprof --profile-child-processes ./myscript.py
と、同じ ID を持つプロセスが各 GPU で開始されます。
nvprof
プロファイリングに 1 つの GPU のみを使用するために私ができる議論はありますか?