問題タブ [intel-vtune]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
531 参照

profiling - NVIDIA GPU を使用した Windows での OpenCL アプリケーションのプロファイリング

手伝って頂けますか?Windows 7 x64 で OpenCL アプリケーションを開発しています。ハードウェアは Intel Core i5、NVIDIA GTX 770 です。OpenCL はアクセラレーションに NVIDIA を使用します。

インテル VTune Amplifier XE 2015 を使用しようとすると、プロファイリングの最後でアプリケーションがハングし、レポートが返されません。ドキュメントでは、すべての「Cn(ACPI Cn) report to OS」BIOS オプションを無効にすることを推奨しています。しかし、このハングを回避するためにアプリケーション コードを変更する方法はまったく不明です。

また、このマニュアルを使用して NVVP を利用しようとしましたhttps://github.com/UoB-HPC/UoB-HPC.github.io/blob/master/_posts/2015-05-27-nvvp-import-opencl.md . 残念ながら、プロファイラーはエラーを生成します: アプリケーションをプロファイリングできません。「別の CUDA ツール (プロファイラー、デバッガー、memcheck) が現在実行されているため、アプリケーションをプロファイリングできません」。このエラーは、NVVP のみが実行されている場合にも表示されます。

0 投票する
1 に答える
259 参照

c++ - VS2015 コンソール アプリケーションの Intel Vtune Amplifier XE2016 による高度なホットスポット分析が機能しない

私の単純な (数行) VS2015 コンソール C++ (ネイティブ) アプリケーションの Intel "高度なホットスポット、スタック、およびコンテキスト スイッチ分析" (またはそれ以上) を実行すると、その処理がハングし、Windows の再起動が必要になります。サンプル ソリューションとスクリーン キャプチャを参照してください。 zipファイルに同封されています)。同じことが大規模なソリューションにも当てはまります... "。「基本的なホットスポット」と「スタックなしの高度なホットスポット...」は問題なく動作します。誰か助けてくれますか?

ホットスポット設定のソリューションとスクリーン キャプチャ:

https://app.box.com/s/ihb51o9cxrn8y7li6eupa9o7qbkof4dp

Windows 10Pro 64bit Build 1607、Intel Core I7-4771 VS2015 Community V. 14.0.25431.01 Updt. 3 インテル VTume アンプ。XE2016 Updt 2、ビルド 444464 助けてくれてありがとう!!!!

0 投票する
1 に答える
274 参照

c++ - マルチスレッドのパフォーマンスの問題

マルチスレッドプログラムがあります。スレッドプールの独自の実装を使用します。まず、プロジェクトの負荷は十分です。シングルスレッドに比べて、2 スレッドのプログラムの方が高速です。

スレッド数を 2 以上に増やすと、パフォーマンスが著しく低下します。明らかに、マルチスレッドのパフォーマンスの問題が発生しました。

その後、インテル® VTune™ Amplifier XE 2017 パフォーマンス解析の使用を開始し、このツールを VS2013 に統合しました。次に、Intel® VTune™ Amplifier XE のスター ボタンをクリックすると、驚くべきことが起こりました。プロジェクトが実行を開始し、plug が Data を収集します。プラグインを介してこのプロジェクトを開始すると、スレッド数が増えるにつれて、パフォーマンスが向上し、実行時間が短縮されることがわかりました。最大 20 個のスレッドを開くことができます。そして時間が20倍短縮

インテル® VTune™ Amplifier XE 2017 は、マルチスレッド・プログラムの動作モードを変更できますか? なぜこれが起こるのですか?私は長い間この問題に悩まされてきました。

0 投票する
4 に答える
2330 参照

c++ - C/C++ アプリケーションでメモリ アクセスに費やされた時間をプロファイリングする方法は?

アプリケーション内の関数が費やした合計時間は、次の 2 つの要素に大きく分けることができます。

  1. 実際の計算に費やされた時間 (Tcomp)
  2. メモリ アクセスに費やされた時間 (Tmem)

通常、プロファイラーは、関数が費やした合計時間の見積もりを提供します。上記の 2 つのコンポーネント (Tcomp と Tmem) に関して費やされた時間を見積もることは可能ですか?