命令フェッチに問題があるカーネルを書きました。問題ストールの原因の 75% 以上は、命令フェッチが原因です。
これを改善する方法がわかりません。Nvidia は命令フェッチ ポリシーについて何も述べておらず、Nsight のドキュメントにも「次のアセンブリ命令がまだフェッチされていない場合の命令フェッチ ストールの理由」という記述はありません。
この問題を回避する (または影響を軽減する) 方法はありますか?
命令フェッチに問題があるカーネルを書きました。問題ストールの原因の 75% 以上は、命令フェッチが原因です。
これを改善する方法がわかりません。Nvidia は命令フェッチ ポリシーについて何も述べておらず、Nsight のドキュメントにも「次のアセンブリ命令がまだフェッチされていない場合の命令フェッチ ストールの理由」という記述はありません。
この問題を回避する (または影響を軽減する) 方法はありますか?