問題タブ [intel-vtune]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
architecture - Xeon Phi の vtune で発生する可能性のあるバグ
xeon phi コアで vtune を実行したところ、シングル スレッド ベンチマークで 0.777 の CPI が得られました。ただし、単一スレッドの理論上の最大 CPI は 1.0 であるため、これが真実である可能性はほとんどありません。( https://software.intel.com/en-us/articles/optimization-and-performance-tuning-for-intel-xeon-phi-coprocessors-part-2-understandingで「理論 CPI」を検索してください)
vtune スレッド情報を確認して、他のスレッドが実行されていないことを確認しました。
- VTune CPI 情報:
Function / Call Stack Clockticks Instructions Retired CPI Rate Retiring Bad Speculation Back-End Bound Front-End Module Function (Full) ソースファイル開始アドレス
上記の情報から、CPI は 0.777 です。
- 関数 centered_3d の VTune スレッド情報:
239.616s -- 同時に使用される論理 CPU = 0
163.632s -- 同時に使用される論理 CPU = 1
上記の情報は、vtune が間違った計算を行っていることを意味しますか? 例: サイクル数または命令数を正しくカウントしない可能性はありますか?
directshow - Intel Vtune Amplifier を使用したプロファイリング
いくつかの静的ライブラリを使用して 1 つのフィルター dll を作成しました。この dll はグラフ スタジオで使用され、正常に動作しています。しかし、dll のプロファイリングを行う必要があるため、Graph Studio を開始してから vtune を開始しました。vtune プロジェクト プロパティで、プロセスにアタッチし、プロファイル レポートを正常に生成しました。しかし、コードの c/c++ ソースではなく、コードのアセンブリしか見ることができません。Vtune で自分の dll のソース コードを表示するにはどうすればよいですか?
linux-kernel - システムプロファイリング - 共有ライブラリの使用情報
一定時間内にどのライブラリファイルがどのプロセス (またはプロセスの数) によって使用されているかを知る方法はありますか?
V-Tune、perf、または OProfile を使用できますか?
assembly - Vtune 解析を特定の機能に制限する方法
私は基本的な構造が以下のようなプログラムを持っています:
アセンブリ言語プログラムは基本的に、バッファー内のデータのチェックサムを計算します。私の意図は、それを絶対最大値まで最適化することです。システム コールやライブラリ関数の呼び出しは行いません。
Intel vTune Amplifier XE スイートを VS 2015 にインストールしました。
アセンブリ言語のルーチン部分だけに絞って、「C」言語の準備部分の解析をすべてスキップするように vtune に指定するにはどうすればよいでしょうか。INSTRUCTION COUNT や CPI など、すべてのデータが累積されているようです。アセンブリ言語サブルーチン内のループと分岐のみのデータを取得することは可能ですか。もしそうなら、どうすればそれができるか教えてください。
ありがとう
floating-point - FP_COMP_OPS_EXE.X87 などの操作名の解釈方法
Intel VTuen を使用してプログラムの命令を収集すると、次のような結果が得られます
各操作の名前で、「FP」は浮動小数点、「OPS」は操作を意味することは知っていますが、「COMP」は何を表しているのでしょうか。私の最初の理解では、「COMP」は比較を意味するということですが、本当ですか? もしそうなら、ここでの比較はどういう意味ですか?
c++ - intel Vtune の整数加算および減算イベント カウントはどこにありますか?
プログラムのプロファイリングに Intel VTune を使用しています。
使用しているCPUはIVY Bridgeです。
すべてのハードウェア命令イベントは次の場所にあります。
https://software.intel.com/en-us/node/589933
FP_COMP_OPS_EXE.X87 このサイクルで実行された FP 計算 Uop の数。FADD、FSUB、FCOM、FMUL、整数 MUL、IMUL、FDIV、FPREM、FSQRTS、整数 DIV、および IDIV の数。このイベントは、超越フローの途中で使用される FADD と s を区別しません。
FP_COMP_OPS_EXE.X87 には整数乗算と整数除算が含まれているようです。ただし、そこには整数加算と整数減算はありません。上記のWebサイトからも、これら2種類の指示を見つけることができません。
整数加算命令と整数減算命令をカウントするイベントとは何か教えてもらえますか?
c++ - intel Vtune アンプを使用したウォール クロック時間に基づくプロファイル C++ プログラム
Intel VTune Amplifier XE を使い始めたばかりで、デフォルトでは CPU 時間のみの測定のようです。実時間 (リアルタイム) に基づいて結果を取得するように VTune を設定することはできますか? 実際、私の目標は、ディスク I/O 操作からホットスポットを取得することです。