問題タブ [cpu-speed]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
.net - クロスコア コンテキスト スイッチの数を最小限に抑える
私は最近、(Visual Studio Performance Wizard を使用して) アプリケーション プロファイリングをいろいろ試していました。同時実行インジケーターを操作しているときに、アプリケーションが複数のスレッド (バックグラウンドとフォアグラウンドの両方) で実行されている場合、クロスコア コンテキスト スイッチ レートが非常に高いという事実に気付きました。
一般に、多数のクロスコア コンテキスト スイッチがアプリケーションのパフォーマンスに悪影響を与える可能性があることを知っているため、最小限に抑えたいと考えています。
同時に実行されるスレッドの数を最小限に抑える以外に、.NET アプリケーションでこれを行うにはどのような方法がありますか?
c++ - 動的周波数スケーリングを無効にする方法は?
いくつかのマイクロベンチマークを行い、それらを正しく実行したいと考えています。残念ながら、動的な周波数スケーリングでは、ベンチマークの信頼性が非常に低くなります。
動的周波数スケーリングが有効になっているかどうかをプログラム (C++、Windows) で確認する方法はありますか? 場合、これをプログラムで無効にできますか?
実際のベンチマークが行われる前に 1 秒間 100% の CPU を使用するウォームアップ フェーズを使用しようとしましたが、これも信頼できないことが判明しました。
更新: BIOS で SpeedStep を無効にしても、cpu-z は周波数が 1995 から 2826 GHz の間で変化することを示します
c - CPU パフォーマンスと比較して、CUDA または OpenCL の速度をベンチマークできますか?
一般的なシングル プロセッサ コアと比較して、CUDA または OpenCL コードのアルゴリズムはどれくらい高速に実行できますか? (アルゴリズムは、CPU と GPU の両方のターゲットに対して記述および最適化されていることを考慮してください)。
グラフィックカードとCPUの両方に依存することは知っていますが、NVIDIAの最速GPUの1つと(シングルコアの)Intel i7プロセッサと言ってください。
また、アルゴリズムの種類にも依存することを知っています。
厳密な回答は必要ありませんが、経験豊富な例:倍精度浮動小数点を使用する画像操作アルゴリズムの場合、ピクセルあたり 10 回の操作で最初の 5 分かかり、このハードウェアを使用すると x 秒で実行されます。
cpu - その時点で実行されないコードの部分を含む大きなバイナリは、レベル 2 CPU メモリの使用に影響しますか?
L2 が満たされていない場合、CPU は大幅に高速に動作するようです。プログラマーは、コードの一部が常に実行されなくても、最終的にはバイナリでより小さくなるものをコーディングするほうがよいでしょうか? たとえば、構成ファイルでのみオンになっているコードの一部です。
android - AndroidのCPU速度を検出するには?
Android アプリケーションが実行されているデバイスの速度を検出したいですか?
Androidでそれを行うAPIはありますか? それとも、自分でベンチマークする必要がありますか?
デバイスの CPU が遅い場合、アニメーションなどの時間のかかる操作をオフにしたり、同時 HTTP リクエストの最大数を制限したりしたいと考えています。
assembly - ワードサイズとクロック速度の違いは?
私の質問が関連しているかどうかはわかりません.しかし、私が知りたかったのは、これが両方ともCPUのパフォーマンスにどのように影響するかということです??同じアーキテクチャのCPUについて私が知っている唯一のことは、クロック速度が高いほど、 CPUの処理能力ですが、ワードサイズはどうですか??CPUの速度にどのように影響し、どちらが実際にCPUの速度を決定しますか??互いに矛盾していますか??ありがとう。
optimization - マシンコードの位置合わせ
マシンコードのアライメントの原則を理解しようとしています。実行時にマシンコードを生成できるアセンブラー実装があります。すべての分岐先で 16 バイトのアラインメントを使用していますが、最適な選択ではないようです。アラインメントを削除すると、同じコードよりも高速に動作する場合があることに気付いたからです。キャッシュ ライン幅と関係があると思います。そのため、一部のコマンドがキャッシュ ラインによってカットされ、そのために CPU がストールします。そのため、ある場所に数バイトのアラインメントが挿入されると、キャッシュの境界線を越えてどこかに命令が移動します...
コード全体を処理し、CPU の仕様 (キャッシュ ライン幅、32/64 ビットなど) に従ってアラインメントを挿入できる自動アラインメント手順を実装したいと考えていました...
誰かがこの手順についていくつかのヒントを与えることができますか? 例として、ターゲット CPU は Intel Core i7 CPU 64 ビット プラットフォームである可能性があります。
ありがとうございました。
windows - MS-Windowsスケジューラ制御(またはその他)-低速のCPUでアプリケーションのパフォーマンスをテストしますか?
MS-Windows(私の場合はXP-SP3 32ビット)スケジューラーを制御できるツールはありますか?ターゲットアプリケーション(テストしたい)は、低速のCPUで実行されているかのように動作します。私の物理ホストが2.4GHzvデュアルコアであるとしましょう。しかし、アプリケーションを800MHz /1.0GHzCPUで実行されているかのように実行したいとします。
古いDOSゲームの実行速度を低下させるようなプログラムがあることは知っていますが、AFAIKでは、CPUサイクルを消費してアプリケーションを枯渇させるというアプローチを取っています。そんなことはしたくないし、時計をもっと正確にコントロールしたいです。
performance - CPU の理論上のピーク パフォーマンスを計算する方法
ここに私のcat /proc/cpuinfo
出力があります:
このマシンには 2 つの CPU があり、それぞれがハイパースレッディング機能を備えた 4 つのコアを備えているため、合計プロセッサ数は 16 (2 CPU * 4 コア * 2 ハイパースレッディング) です。これらのプロセッサは同じ出力を持っています。きれいに保つために、最後のものの情報を表示し、フラグ行のフラグの一部を省略しています。
では、このマシンのピーク パフォーマンスを GFlops で計算するにはどうすればよいでしょうか。さらに情報を提供する必要がある場合はお知らせください。
ありがとう。
cpu - CPUのクロック速度とクロック周期の関係
このスライドでは、物事が少し外れているように見えます。クロックサイクル時間またはクロック周期は、すでにクロックサイクルごとに必要な時間です。質問は、その言葉Clock Rate
は意味がありますか?
また、と言いHardware designer must often trade off clock rate against cycle count
ます。しかし、それらは反比例の関係にあります。クロック速度を上げると、クロック周期(クロックサイクルあたりの時間)が自動的に短くなります。なぜ選択肢があるのでしょうか?
それとも私は何かが足りないのですか?