memory - RAM が遅い場合でも、1 サイクルの命令は 1 サイクルかかりますか?

Question

組み込み RISC プロセッサを使用しています。私が理解するのに問題がある基本的なことが1つあります。

CPU のマニュアルには、命令ld r1, [p1](C では r1 = *p1) に 1 サイクルかかることが明記されています。レジスタ r1 のサイズは 32 ビットです。ただし、メモリバスは 16 ビット幅しかありません。では、1 サイクルですべてのデータを取得するにはどうすればよいでしょうか。

score 7 · Accepted Answer

クロックタイムは、全幅ゼロウェイトステートメモリを想定しています。コアがその命令を実行するのにかかる時間は、1 クロックサイクルです。

各命令が異なる数のクロックサイクルを必要とする時期がありました。メモリも比較的高速で、通常は待機状態はゼロでした。パイプラインの前にも、クロックサイクルのフェッチ、クロックサイクルのデコード、クロックサイクルの実行、さらに可変長命令用の追加のクロックサイクルと、命令にメモリ操作がある場合の追加のクロックサイクルをバーンする必要があった時期がありました。

今日、クロック速度は高速で、チップの不動産は比較的安価であるため、パイプラインやキャッシュと同様に、1 クロックサイクルの加算または乗算が標準になっています。プロセッサーのクロック速度は、もはやパフォーマンスの決定要因ではありません。メモリは比較的高価で低速です。したがって、キャッシュ (構成、数、およびサイズ)、バスサイズ、メモリ速度、周辺機器の速度によって、システムの全体的なパフォーマンスが決まります。通常、プロセッサのクロック速度を上げても、メモリや周辺機器ではなく、パフォーマンスの向上は最小限に抑えられますが、場合によっては遅くなる可能性があります。

メモリサイズと待機状態は、リファレンスマニュアルのクロック実行仕様の一部ではありません.コア自体が各命令のクロック単位であなたにかかるコストについてのみ話しています. 命令バスとデータバスが分離しているハーバードアーキテクチャの場合、メモリサイクルで1クロックが可能です。命令のフェッチは、少なくともその前のクロックサイクルで発生するため、クロックサイクルの開始時に命令の準備が整い、デコード、および実行 (メモリの読み取りサイクル) が終了の 1 クロックの間に発生します。 1 クロックサイクルで、読み取りの結果がレジスタにラッチされます。命令バスとデータバスが共有されている場合、それでも 1 クロックサイクルで終了すると主張できますが、次の命令をフェッチすることができないため、そこで少しストールが発生します。

score 2 · Accepted Answer

私の理解は次のとおりです。一部の命令が1サイクルかかると言うとき、命令が1サイクルで終了するわけではありません。命令pipe-lineのカウントを考慮する必要があります。CPU に 5 ステージのパイプラインがあるとします。その命令は、順番に実行すると 5 サイクルかかります。

memory - RAM が遅い場合でも、1 サイクルの命令は 1 サイクルかかりますか?

2 に答える 2

Related

Reference