問題タブ [cpu-speed]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - タスクの完了に未定義の時間がかかる機能をテストする方法
現在、Web サイトを開発していて、いくつかのバグに遭遇しました。バグを修正するには、バグを再現してデバッグなどを行う必要があります。一部のバグでは、限られた時間枠内でボタンクリック/チェックボックス マーキングの特定の組み合わせを繰り返す必要があります。つまり、リクエストが送信されたときに前のリクエストが処理されないように、複数の同一のリクエストをバックエンドに送信できる必要があります。これがバグを再現できる唯一の方法です。
さて、私の問題は、PC が速すぎるため、バグを再現するのに十分な速さで必要な手順を実行できないことです..そのため、新しいリクエストを送信する前に、バックエンドが各リクエストの処理を終了します。
このような再現の問題を解決するにはどうすればよいですか? - CPU のクロック周波数を下げることを考えていますが、バグを再現できるようにするためだけに、それは非常に行き過ぎているようです。この問題を解決するために使用できる何らかのテスト フレームワークはありますか? -ブラウザプラグインを介してリクエストをすばやく再送信する何らかの方法があります..わかりません..そして、Googleはまだ私にとって役立つものを見つけていません..だから、ここの他の開発者が同様の問題を抱えていて、いくつかのポインタがあることを望んでいました.私のため :)
architecture - マルチサイクルとシングルサイクルの MIPS の計算と奇妙な答えの取得
シングルサイクルとマルチサイクルの 2 つのシステムの MIPS を計算する必要があるという問題があります。私は数学を正しく行っているとは思わない.
GHz の計算 シングル サイクル システムの場合...
私の理解では、シングルサイクルシステムは、最も遅い命令と同じ速さでしか実行できないということです。最も遅い命令の実行には 3.96 x 10^(-10) 秒かかります。つまり、1 秒あたり 1 / (3.96 x 10^(-10)) 回、その命令を実行できることを意味します。つまり、1 秒あたり 2.53 x 10^9 サイクル、つまり 2.53 GHz になります。
私のマルチサイクルシステムの GHz の計算...
マルチサイクル命令の平均速度は 3.6862 x 10^(-10) 秒です。つまり、毎秒 1 / (3.682 x 10^(-10)) 回実行できることを意味し、毎秒 2.71 x 10^9 サイクル、つまり 2.71 GHz になります。
...
さて、これまでのところ私には理にかなっています。マルチサイクルシステムはより効率的であるため、全体的に高速に実行できます。しかし、この次の部分で、私は紛らわしい答えを得ています。
シングル サイクル システムの MIPS 評価を計算しています...
シングルサイクルシステムなので、自動的に1サイクル/インストゥルメントとなります。
それはたくさんのようです。特に私の次の答えを考えるとき。
マルチサイクルシステムの MIPS 評価を計算しています...
マルチサイクル システムの命令あたりの平均サイクル数: 4
私のシングルサイクルシステムが私のマルチサイクルシステムのほぼ x4 の MIPS を計算できる方法はありませんよね?
私の計算に何か問題があるに違いありません。そうでなければ、これらのシステムの仕組みについて根本的なことを誤解しています。
どんな援助でも大歓迎です。
どうもありがとうございました!
performance - 平均 cpi を計算するにはどうすればよいですか?
私はちょっと仕事に行き詰まっています。cpiを見つけるには、命令のパーセンテージにクロックサイクルを掛ける必要がありますが、表示されるのは平均ストールサイクルです。この問題にアプローチする方法がよくわかりません。どんな助けでも大歓迎です。
5 ステージのパイプラインを備えたコンピューターが測定され、次の特性があります。</p>
命令タイプ 命令の %。平均 ストールサイクル/命令
ブランチ .3 .7 </p>
ロード & ストア .2 .2 </p>
ALU ops .4 0 </p>
その他 .1 .2 </p>
a) コンピューターの平均 CPI は?
b) このマシンのスピードアップは?
python - 高速な python 行列の作成と反復
重み行列の値から始まる行列を作成する必要があります。マトリックスを作成するときと反復するときの両方の速度の観点から、マトリックスを保持するのに最適な構造はどれですか? リストのリストまたはnumpy 2D配列について考えていましたが、どちらも遅いようです。必要なもの:
また
ここで、dim は 20000 にすることもできます。node_degree はベクトルで、arc_weight は別の行列です。私はC ++で書きました.0.5秒未満しかかかりませんが、他の2つはPythonで20秒以上かかります. Python が C++ ではないことは知っていますが、できるだけ速くする必要があります。皆さん、ありがとうございました。
java - 反復後の計算時間の短縮
ソートアルゴリズムの効率化に関するプロジェクトを行っています。バブルソートを 50 回繰り返して、n 個の数値にかかった平均時間を見つけたとします。しかし、最初の数回の反復は、後続の反復よりも常に遅いことに気付きました
例: 1394ms、1381ms、1001ms、1008ms、1008ms、1011ms...
その背後にある理由は何ですか?これは、CPU がどのデータ セットをキャッシュに格納するかを判断できるためですか? もしそうなら、それは現実的ではないので、その後の計算時間を分析に使用すべきではありませんか?
ありがとう!
編集:私は他のソートアルゴリズムも行っています。例としてバブルソートですが、挿入を除いて、私が行ったすべてのソートで発生します
c - プログラムの一部のスレッドが CPU サイクルを取得していません
私が作成したプログラムがあります160 threads
-それぞれに向けられたデータと1つのスレッドで作業するため-データをマップに保持します。
プログラムの実行中にすべてのスレッドが作成されました。
問題:
160 個のスレッドのうちの一部のスレッドが、データ スレッドのマップからデータを読み取ることができない場合があります。
を減らしてみましたMutex locks
が、それでも問題は同じままです。
同じことを手伝ってください。
performance - LWJGLでピクセルレンダリングを高速化するには?
LWJGL でさまざまなレンダリング方法を試していました。私はこの方法に出会いましたglDrawPixels(width, height, format, type, bytebuffer)
。そこで、この方法で LWJGL でピクセルだけをレンダリングしてみることにし、次のように思いつきました。
これは完全に機能しましたが、通常の LWJGL マトリックス モード レンダリングを使用した場合よりも fps が約 500 フレーム少ないことに気付きました。では、ピクセルをループして RGBA 値をフレームごとにバイトバッファに追加する必要がないように、どうすれば高速化できますか?
matlab - 複数の組み込み for ループの Matlab ベクトル化
v_1、v_2、v_3、v_4、v_5 の 5 つのベクトルがあるとします。これらのベクトルにはそれぞれ、最小値から最大値までの範囲の値が含まれています。たとえば、次のようになります。
これらのベクトルはそれぞれ同じステップ サイズを使用しますが、最小値と最大値は異なります。このように、それぞれ長さが異なります。
関数 F(v_1, v_2, v_3, v_4, v_5) はこれらのベクトルに依存しており、それらの要素の任意の組み合わせを使用できます。(説明が下手で申し訳ありません)。F の最大値を見つけて、その結果の値を記録しようとしています。私の現在のアプローチは、ベクトル要素のすべての組み合わせに対して関数を実行するために、示されているように複数の組み込み for ループを使用することでした。
ステップサイズが小さい場合、これは非常に遅くなります。各ベクトルに約 100 個の要素がある場合、組み合わせの数は約 100*100*100*100*100 になります。適切に収束した答えを得るには小さなステップ値が必要なので、これは問題です。
Vectorizationまたはその他の方法を使用してこれを高速化できるかどうか疑問に思っていました。計算の前に組み合わせを生成することも検討していましたが、これは現在の方法よりもさらに遅いように見えました。私は長い間Matlabを使用していませんが、埋め込まれたforループの数を見るだけで、これは間違いなく高速化できると思います。提案していただきありがとうございます。