nvvp を使用して pyCUDA アプリケーションをプロファイリングしようとすると、ほとんどの場合うまくいきます。[GPU 使用率の調査] をクリックすると、「低コンピューティング / Memcpy 効率」など、コードの分析結果や提案が多数表示されます。
ただし、nvvp がプログラムを実行して分析を実行するたびに、次の警告が表示されます。
収集されたイベント、メトリック、またはソース レベルの結果の一部をセッション タイムラインに関連付けることができませんでした。これにより、イベント、メトリック、およびソース レベルの結果が一部のカーネルに割り当てられなくなる場合があります。
これを修正すれば、より詳細な分析ができるようです。「収集されたイベント、メトリック、またはソースレベルの結果をセッションタイムラインに関連付ける」方法を知っている人はいますか?