問題タブ [flops]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - C++ は GFlops を計算します
最近、FLOPS を計算する簡単なプログラムを作成しようとしています。十分に速いのでc++
、近い結果を出すために試してみる価値があると思います。
Notepad++ プラグインでコンパイルすると、NppExec
正常に動作しますが、ビルドしません。CodeBlocks でビルドして実行すると、反復が続き、プロセスが完了しません。そのため、notepad++ に戻って再度コンパイルすると、今回は正常に動作し、反復が 1 秒経過しただけです。
結果をより正確にする方法を知っている場合は、先に進んでください。どんな回答でも大歓迎です!
kernel - CPU-GPU FLOP Rate
I need to calculate how many flops per transferred value a code should provide so that running the code on GPU will be worth enough to increase the performance.
Here are the flop rates and assumptions:
1. PCIe 16x v3.0 bus is able to transfer data from CPU to GPU at a rate of 15.75 GB/s.
2. GPU is able to perform 8 single precision TFLOPs/second.
3. CPU is able to perform 400 single precision GFLOPs/second.
4. Single precision floating point number is 4 bytes.
5. Calculation can overlap with data transfers.
6. Data is originally placed in the CPU.
How would a problem like this be solved step by step?
fortran - メモリ帯域幅情報を使用した HPC アプリケーションの mflop/s の計算
アプリケーションを実行せずに、HPC アプリケーション (NAS ベンチマーク) の mflops (プロセッサごとに 1 秒あたりの百万回の操作) を計算したいと考えています。Stream Benchmark を使用して、システム (スーパーコンピューター) の各コアのメモリ帯域幅を測定しました。コアのメモリ帯域幅情報を取得することで、アプリケーションのプロセッサあたりの mflops を取得する方法を考えています。私のノードには 64GiB メモリ (16 コア - 2 ソケットを含む) と、すべての物理コアを使用した 58 GiB/秒の集約帯域幅があります。私のコアのメモリ帯域幅は 2728.1204 MB/s から 10948.8962 MB/s まで変化しますが、それは NUMA アーキテクチャのためです。
どんな助けでも感謝します。
performance - 実際のメモリ帯域幅を使用した場合の実際のフロップ/コアの計算
次の情報を使用して、mflop/s/core の実際の量を計算したいと思います。
1 ノードの各コアの実際のメモリ帯域幅を測定したところ、4371 MB/秒でした。
また、ノードで 1 つのコアのみを使用する場合、1 つのノードで mflop/s/core を測定しました (この場合、ノードのメモリ全体がそのコアで使用可能です)。結果は 2094.45 です。そのため、そのコアで利用可能なメモリ帯域幅を測定しました = 10812.3 MB/s
したがって、コアに実際のメモリ帯域幅 (4371MB/s) がある場合の実際の mflop/s/core を計算したいと思います。
次のように計算すると正しいと思いますか。
実際の mflop/s/core= (mflop/s/core * 実際のメモリ帯域幅) / 使用メモリ帯域幅
どんな助けでも大歓迎です。
fpga - FLOPS (浮動小数点演算) の数から消費電力を推定しますか?
各アルゴリズムが消費しているフロップ (浮動小数点演算) の数を抽出しました。
- このアルゴリズムを FPGA に実装するか、CPU に実装するかは疑問ですが、消費される電力量を (少なくとも大まかに) 予測できますか?
CPU または ASIC/FPGA での消費電力の見積もりは、私にとっては適切です。数式のようなものを探しています。Intel CPUに関するこのジャーナル ペーパーがあります。命令ごとの消費電力(浮動小数点演算だけでなく、アドレッシング、制御などのすべての命令)が得られるため、特別なプロセッサのコードの命令数ではなく、FLOPSに基づいて電力を供給するには、より一般的なものが必要です。
benchmarking - 各コアの計算能力
システム (スーパーコンピューター) の各コアの計算能力を測定するベンチマークを探しています。つまり、1 つのプロセッサで現実的に実現可能な 1 秒あたりの浮動小数点演算の最大数を見つけたいのです。私にとって役立つかもしれない SPEC という名前のベンチマークを見つけましたが、無料ではありません。この目的に適したベンチマークを教えてください。
どんな助けでも大歓迎です。