問題タブ [intel-vtune]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
248 参照

intel - Intel Vtune: Power driver not accessible

I'm trying to run Intel vtune power analysis on intel(R) Core(TM) i7-3632QM CPU running Ubuntu 13.04 i keep getting "Power driver is inaccessible. Make sure the driver is installed and you have permission to access it." I tried building and loading drivers manually, the sepdk builds and loads correctly but loading the powerdk driver gives the error

"Setting group ownership of device to group "vtune" ... ./insmod-apwr: 475: [: vtune: unexpected operator Not managed to install the driver with the proper group. Wrong group is vtune Setting group ownership of device to group "vtune" ... ./insmod-apwr: 475: [: vtune: unexpected operator Not managed to install the driver with the proper group. Wrong group is vtune Setting group ownership of device to group "vtune" ... ./insmod-apwr: 475: [: vtune: unexpected operator Not managed to install the driver with the proper group. Wrong group is vtune ./insmod-apwr: 487: [: vtune: unexpected operator Setting file permissions on device to "660" ... done. ./insmod-apwr: 514: [: vtune: unexpected operator ./insmod-apwr: 528: [: unexpected operator The apwr3_1 driver has been successfully loaded."

Could it be that my processor is not supported?

0 投票する
1 に答える
152 参照

multithreading - プロセッサ アフィニティを設定できません

このコードを 8 コア クラスターに実装しようとしています。それぞれ 4 コアの 2 つのソケットがあります。関数を使用して 8 つのスレッドを作成し、アフィニティを設定しようとしていpthread_attr_setaffinity_npます。しかし、VTunes でのパフォーマンスを見ると、3969 個の奇妙なスレッドが作成されていることがわかります。理由と方法がわかりません!何よりも、アフィニティが設定されていないとき (OS スレッドのスケジューリング) とまったく同じパフォーマンスが得られます。誰かがこの問題のデバッグを手伝ってくれますか? 私のコードは完全に正常に動作していますが、スレッドを制御できません! 前もって感謝します。

- - - - - - - - - - - - - - - - - - - コード - - - - - - --------------------------------

0 投票する
1 に答える
172 参照

intel - Intel Vtune からのメモリ トレース

intel vtune から命令カウントに沿ってメモリ トレース情報を抽出することは可能ですか? はいの場合、この操作を実行する方法を教えてください。

ありがとう

0 投票する
1 に答える
310 参照

c - ループ展開後にリタイアする命令の減少

O(N^4) 画像処理ループがあり、(Intel Vtune 2013 を使用して) プロファイリングした後、リタイアした命令の数が大幅に減少していることがわかります。マルチコア アーキテクチャでのこの動作を理解するのに助けが必要です。(私は Intel Xeon x5365 を使用しています - 2 つのコアごとに共有 L2 キャッシュを持つ 8 つのコアがあります)。また、分岐予想外も激増!! ///////////////EDITS/////////// 非展開コードのサンプルを以下に示します。

最も内側のループを 4 回の反復で展開しています (ループをどのように削除したかという一般的な理想が得られます。基本的には、Array[4] の配列を作成し、それぞれの値を入力します)。反復回数の合計を 75% 削減します。すべてのループ (load i、inc i、cmp i、jle ループ) に 4 つのループ処理命令があるとします。アンロール後の命令の総数は、(256-64)*4*256*256*496=24.96G 減少するはずです。 . プロファイリングされた結果は次のとおりです。

引退したインストルメントは 518.06G 減少しました。これがどのように起こっているのか、私にはわかりません。これに関する助けをいただければ幸いです(たとえそれが発生する可能性が低い場合でも)。また、ブランチの予測ミスが増えている理由を知りたいです。前もって感謝します!

0 投票する
1 に答える
881 参照

intel-vtune - intel® VTune™ Amplifier XE 2013 不明なソース ファイル

レポートに不明なソース ファイルがあるため、レポートを分析するための正しいループを微調整できません

vtune analyze でソース コードを表示したいのですが、c をコンパイルして実行ファイルを取得すると、挙動を解析しようとしたらアセンブリコードしかチェックできない!ソースコードを表示する方法を知っている人はいますか? また、itt_pause() と itt_resum() を実行したい場合、icc コンパイラを使用せずにファイルを次のようにコンパイルするにはどうすればよいでしょうか。

分析する必要があるソース コード:

0 投票する
2 に答える
1860 参照

c++ - Intel Vtune を使用して Qt Creator からアプリケーションをプロファイリングする

Windows 7 で Vtune を使用して QtCreator からアプリケーションをプロファイリングしたい。しかし、Vtune は基本的に Visual Studio アプリ用に作成されているため、関数の名前とリリース ビルドの命令の間にリンクを作成する必要があります。実際、ホットスポットには疑似名 func@address しかなく、使用できません。

Intel Vtune の「はじめに」を調べると、リリース ビルドでデバッグ情報を有効にする必要があることがわかりましたが、QtCreator でそれを実行するにはどうすればよいですか?

「デバッグ情報の使用」ファイルから:

正確なパフォーマンス データを提供し、ソース解析を可能にするために、インテル® VTune™ Amplifier は、解析するバイナリ ファイルのデバッグ情報を必要とします。バイナリーでデバッグ情報が見つからない場合、インテル® VTune™ プロファイラーは静的に関数の境界を識別し、そのような関数に対して生成された疑似名 func@address にホットスポット・アドレスを割り当てます。

デバッグ情報が存在しない場合、ユーザー モードのサンプリングおよびトレース分析の種類に対して、[呼び出し履歴] ウィンドウで呼び出し履歴が正しく巻き戻されない場合があります。さらに、場合によっては、デバッグ情報を持たないモジュールの結果を確定するのに非常に長い時間がかかることがあります。

Windows* オペレーティング・システムでは、PDB ファイルはデバッグ情報を提供します。システムとアプリケーション ライブラリ/実行可能ファイルの両方に PDB ファイルがあることを確認してください。ターゲットを最適化してコンパイルし、そのパフォーマンスのプロファイリングを開始します。

デフォルトでは、Microsoft* Visual Studio* IDE はリリース・モードで PDB 情報を生成しません。インテル® VTune™ Amplifier でより良い結果を得るには、シンボル生成を手動で有効にします。システム ライブラリの場合、Microsoft* Symbol Server を使用して、必要な PDB ファイルを Microsoft* Web サイトからダウンロードします。以下の手順に従って、インテル® VTune™ Amplifier がシステムと独自のライブラリーの両方のデバッグ情報を使用するようにします。

次のようないくつかの方法を試します: - file.pro を編集して、リリース ビルドを変更します。

  • Debug ビルドをプロファイリングします。

しかし、それは何も変更しません。私はまだ関数名を印刷していません

どんな入力でも大歓迎です。