問題タブ [intel-vtune]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
95 参照

windows - 一定期間後のインテル VTune サンプリング

私は VTune を初めて使用し、いじっていました。私が理解できなかった 1 つのことは、20 秒ごとにイベントの複数のサンプルを取得し、それらをテキスト ファイルに保存する方法です。

たとえば、VTune を使用してアプリケーションを実行し、2 分間にわたって 20 秒ごとに一般的な探索結果を取得します。つまり、最後にイベントのサンプルが 6 つあるはずです。

0 投票する
1 に答える
215 参照

windows - インテル VTune コマンド ライン エラー

VTune コマンド ラインを使用して、収集を停止する前に収集するサンプルの最大数を設定しようとしています。このために -msc コマンドを使用していますが、不明なコマンドというエラーが表示されます。

私が使用しているコマンドは次のとおりです: "C:\Program Files\Intel\VTune Amplifier XE 2015\bin32\amplxe-cl" -collect general-exploration --duration 30 -msc 300

上記のコマンドを実行すると、「不明なコマンド -msc」エラーが表示されます

この問題を解決するにはどうすればよいですか。

0 投票する
0 に答える
577 参照

cpu - Xeon Phi のコア使用率を 10Hz で監視するにはどうすればよいですか?

Xeon Phi (Knights Corner、インオーダー プロセッサ) の 60 コアすべての使用率を、比較的高い周波数で、たとえば少なくとも 0.1 秒ごとに測定/監視しようとしてきました。これは 10Hz になります。

最新の PAPI ライブラリを試しました。ただし、完了した命令のカウンターである PAPI_TOT_INS のみをサポートします。0.1秒ごとに発行される命令に関連する何かが実際に必要であり、完了していないため、これは機能しません。異なるサイクルで発行されたいくつかの命令は、同じサイクルで終了する場合があります。命令の発行は、コアが停止しているかどうかによって影響を受けます。

「top」や「perf」などの他のコマンドは 1 Hz で動作しますが、これは私の測定には遅すぎます。より高い周波数が必要です。また、測定をコードの重要なフェーズと同期させる必要もあります。そのため、インテル Vtune プロファイルも機能しません。

Xeon Phi に関する指示の問題や、それらの使用に関連するその他の活動を監視する方法はありますか? これらのハードウェア カウンターがあることは理解していますが、それらを読み取るのは非常に難しいように思えます。各スレッドの CPU 時間を測定することで、この使用率を推測できるでしょうか?

ありがとう。

0 投票する
1 に答える
1078 参照

intel - フロップ測定

intel vtune Amplifier を使用してアプリケーションの FLOPS を推定しようとしています。この投稿をガイドラインとして使用しています: https://software.intel.com/en-us/articles/estimating-flops-using-event-ベース-サンプリング-ebs/

問題は、vtune GUI で FP_COMP_OPS_EXE イベントが見つからないことです。このイベント構成で amplxe-cl を実行すると、次のエラーが発生します。

amplxe: エラー: 無効なイベント FP_COMP_OPS_EXE.X87 が破棄されました。

私はCentOSで作業しており、プロセッサはIntel Xeonです

どんな助けでもいただければ幸いです

0 投票する
1 に答える
786 参照

performancecounter - パフォーマンス測定 - 関数ごとの平均呼び出し時間を取得します。インテル Vtune アンプ

各関数の実行にかかる平均時間を取得しようとしているだけです。つまり、「関数内の合計時間」/「関数の呼び出し数」が必要です。

VTune 内から解析を実行すると、あらゆる種類の情報が得られます。これらは私が使用している設定です:

基本的なホットスポット設定

また:

高度なホットスポット設定

しかし、私は平均時間がどこにあるかを見つけることができません。関数ごとの合計時間はわかりますが、呼び出し回数がわかりません。

Visual Studio 2012、Vtune Amplifier XE 2013、Update 9 を使用。

助けてください。

0 投票する
1 に答える
73 参照

intel - Windows 組み込み OS を使用した VTune

Windows 組み込みオペレーティング システムを使用して VTune 2013 または VTune2015 を使用できるかどうか疑問に思っています。「組み込み版はサポートされていません」というリリース ノートを読みましたが、Windows 組み込みシステムでデータを収集し、標準の Windows システムで結果を表示したり、Windows を使用してリモート モードを実行したりする方法があるかどうかを知りたいです。埋め込まれたターゲット。

ありがとう、

ジョルジオ

0 投票する
0 に答える
127 参照

intel-vtune - 対象のインテル VTune Amplifier XE 2013 モジュール

VTune初心者です。しかし、私は AQTime 8 である程度の経験があります。現在、インテル VTune Amplifier XE 2013 を使用しています。私の意見では、AQTime よりも多くの利点があります。興味深い質問があります。AQtime では、関心のあるモジュールを選択してプロファイルできます。大きなプロジェクトから 1 つの DLL だけをプロファイリングする必要があるため、これは非常に便利です。Intel VTune Amplifier XE 2013 でそのような可能性はありますか?

答えを見つけようとしましたが、これしか見つかりませんでした (バイナリ全体ではなく、バイナリ内の特定のコード スニペットで vtune を使用することは可能ですか? )。

私に助言してください

0 投票する
4 に答える
7761 参照

c++ - 並べ替えられたベクトルで最も近いインデックスを見つける

ソートされた配列で最も近い double 要素を見つける C++ ルーチンを作成しました。スピードアップする方法はありますか?

降順でソートされているreversed場合、 boolean の値に基づいて 2 つの分岐があります。reversed

配列がソートされているまさにこのケースでは、より良い方法がわかりません。したがって、プロファイリングでは、比較if (value <= x[i] && value > x[i + 1])が高価であることがわかります。

編集

lower_bound() で試した

0 投票する
1 に答える
135 参照

intel-mkl - MKL 関数での Vtune 合計時間

私は大学のプロジェクトに取り組んでおり、MKL (11.1.) で実装されているいくつかの三重対角固有値ソルバーの内訳を提供するよう求められています。そのためのテストベッドを実装しましたが、現在、これを vtune (Intel VTune Amplifier XE 2013 Update 16) でプロファイリングしようとしています。ボトルネックを見つける必要があります。つまり、コードのどの部分 (私のものではなく MKL) と、固有値ソルバーによって呼び出されるどの関数に最も多くの時間を費やしているかを見つける必要があります。

そのために、各関数とその呼び出し先で費やされた合計時間を取得したいと考えていました。ただし、取得しているのは各関数のセルフタイムだけです。

私のコードはicc 14.0/3.174でコンパイルされ、MKLを静的および動的にリンクして両方を試しました。

ここでばかげたことを見落としていないことを願っています。また、必要な値を見つける方法に関する他の提案にも非常にオープンです。