問題タブ [nsight-compute]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tensorflow - nv-nsight-cu-cli が原因で Tensorflow が失敗した
最新の Nsight Compute プロファイリング ツールをダウンロードしました。これを使用して、Tensorflow アプリケーションのベンチマークを行いたいと考えています。私が使用しているコードはこちらです。実行すると完全に正常に動作し、ベンチマークを実行しnvprof ./mnist.py
てもまったく問題はありませんでした。ただし、コマンドで実行しようとするとsudo ./nv-nsight-cu-cli [path to the file]
、次のエラーが発生します。
ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory
nv-nsight-cu-cli
どういうわけか環境変数がまったく認識されなかったのではないかと思います。周りに修正はありますか?
cuda - Nsight Compute でのコンピューティング ワークロード分析の解釈
コンピューティング ワークロード分析には、さまざまなコンピューティング パイプラインの使用率が表示されます。最新の GPU では、整数パイプラインと浮動小数点パイプラインは異なるハードウェア ユニットであり、並列で実行できることを知っています。ただし、どのパイプラインが他のパイプラインのどのハードウェア ユニットを表しているかは明確ではありません。また、パイプラインの略語と解釈に関するドキュメントをオンラインで見つけることもできませんでした。
私の質問は次のとおりです。
1) ADU、CBU、TEX、XUのフルネームは? それらはハードウェアにどのようにマッピングされますか?
2) 同じハードウェア ユニットを使用するパイプラインはどれですか (たとえば、FP16、FMA、FP64 は浮動小数点ユニットを使用します)。
3) 最新の GPU のワープ スケジューラは、サイクルごとに 2 つの命令をスケジュールできます (異なるパイプラインを使用)。同時に使用できるパイプラインはどれですか (FMA-ALU、FMA-SFU、ALU-Tensor など)?