残念ながら、ここでコードを共有することはできません (専有) が、私の問題は次のとおりです。SM4 と SM5 の両方で FXC を介してコンパイルできる HLSL (Groestl ハッシュ関数の gpu 実装です) ファイルがあります。私の GPU (AMD Radeon 7800 HD シリーズ) では、SM4 hcs で 3.6 MH/s、SM5 hcs で 6.6 MH/s を取得しています。
同じコード、SM4 と SM5 で大幅に優れたパフォーマンス。SM5 をコンパイルするときに fxc が「ばかげている」という既知のケースはありますか?それをだましてばかげないようにする既知の方法はありますか?
...または、間違ったツリーを鳴らしている可能性があります。これは、GPU に固有のものである可能性がありますか? これを確認するにはどうすればよいですか?