c - CPU キャッシュとキャッシュラインについて

Question

CPUキャッシュがどのように動作しているかを理解しようとしています。この構成があるとしましょう (例として)。

キャッシュサイズ 1024 バイト
キャッシュライン 32 バイト
1024/32 = 32 キャッシュラインがすべて一緒になります。
Singel キャッシュラインは 32/4 = 8 int を格納できます。

1) これらの構成によれば、タグの長さは 32-5=27 ビット、インデックスのサイズは 5 ビット (キャッシュラインの各バイトに対して 2^5 = 32 アドレス) である必要があります。

合計キャッシュサイズが 1024 で、キャッシュラインが 32 ある場合、タグとインデックスはどこに保存されますか? (他に 4*32 = 128 バイトあります。) キャッシュの実際のサイズは 1024+128 = 1152 ということですか?

2) この例でキャッシュラインが 32 バイトの場合、これは、CPU が RAM から新しいバイトを取得する必要があるたびに、32 バイトがキャッシュにコピーされることを意味します。要求されたバイトのキャッシュラインの位置がそのアドレスによって決定されると仮定するのは正しいですか?

つまり、CPU がでバイトを要求した場合、利用可能なキャッシュラインはからまで[FF FF 00 08]のバイトで満たされます。そして、要求された 1 バイトは position になります。[FF FF 00 00][FF FF 00 1F][08]

3) 前のステートメントが正しい場合、32 バイトすべてがとにかくキャッシュラインにあるため、インデックスに使用される 5 ビットは技術的に必要ないということですか?

何か問題がありましたらお知らせください。ありがとう

score 17 · Accepted Answer

キャッシュは、データとタグ RAM で構成され、アクセス時間と効率および物理レイアウトの妥協点として配置されます。ウェイ数 (セット数) という重要な統計が欠落しています。単純なパターンでは異常にパフォーマンスが悪いため、一方向キャッシュはめったにありません。ともかく：

1) はい、タグには余分なスペースが必要です。これは設計上の妥協点の一部です。総面積の大部分を占めたくないので、行サイズが 1 バイトまたは 1 ワードにならない理由です。また、インデックスのすべてのタグが同時にアクセスされるため、多数のウェイがある場合、効率とレイアウトに影響を与える可能性があります。サイズはあなたの見積もりより少し大きいです。通常、有効性をマークするための余分なビットがいくつかあり、場合によってはヒントもあります。より多くのウェイとより小さな行では、タグが占める割合が大きくなる必要があるため、通常、行は大きく (32 バイト以上)、ウェイは小さく (4 ～ 16 バイト) なります。

2) はい。一部のキャッシュでは、「クリティカルワードを最初に」フェッチすることもできます。この場合、ラインフィルの原因となったワードから開始し、残りをフェッチします。これにより、CPU が実際に要求したデータを待機するサイクル数が減少します。一部のキャッシュは「ライトスルー」し、書き込みに失敗した場合はラインを割り当てません。これにより、キャッシュラインに書き込む前に最初にキャッシュライン全体を読み取る必要がなくなります (これは常に成功するとは限りません)。

3) 下位 5 ビットはキャッシュラインに一致させる必要がないため、タグには格納されません。個々の行にインデックスを付けるだけです。

ウィキペディアには、キャッシュに関するかなり良い記事がありますが、キャッシュについてはかなり詳しく書かれています: http://en.wikipedia.org/wiki/CPU_cache - 「実装」を参照してください。データとタグがどのように分割されるかを示す図があります。私は、基礎となるマシンが実際に何ができるかを知っていれば、コードのパフォーマンスを本当に改善できるので、誰もがこのことを学ぶべきだと思います.

score 3 · Accepted Answer

キャッシュメタデータは通常、キャッシュ自体の一部としてカウントされません。CPU の同じ部分に格納されていない場合もあります (別のキャッシュに格納されている場合や、特別な CPU レジスタを使用して実装されている場合など)。
これは、CPU がアラインされていないアドレスをフェッチするかどうかによって異なります。アラインされたアドレスのみをフェッチする場合、あなたが示した例は正しいでしょう。CPU がアラインされていないアドレスをフェッチする場合、0xFFFF0008 から 0xFFFF0027 の範囲をフェッチする可能性があります。
キャッシュアクセスが整列されている場合でも、インデックスバイトは依然として有用です。これにより、CPU は内部のブックキーピングで使用できるキャッシュライン内のバイトを簡単に参照できます。キャッシュラインに関連付けられたアドレスとバイトに関連付けられたアドレスを知ることで同じ情報を取得できますが、持ち運ぶにはさらに多くの情報が必要です。

CPU が異なれば、キャッシングの実装も大きく異なります。あなたの質問に対する最良の回答を得るために、あなたが話している特定の CPU (タイプ、モデルなど) に関する追加の詳細を教えてください。

score 3 · Accepted Answer

これは私の漠然とした記憶に基づいています。Hennessey と Patterson による「Computer Architecture: A Quantitative Approach」などの本を読んでください。素晴らしい本。

32ビットCPUを仮定すると...（そうでなければ、数字は4バイト以上を使用する必要があります（一部/ほとんどの64ビットCPUではアドレス行の64ビットすべてが使用されていないため、おそらく8バイト未満））。

1) 少なくとも 4*32 バイトだと思います。CPU によっては、チップアーキテクトが完全なアドレス以外の情報を追跡することを決定している場合があります。ただし、通常はキャッシュの一部とは見なされません。

2) はい。ただし、マッピングの方法が異なります。ウィキペディアを参照してください- CPU キャッシュ - 連想性単純なダイレクトマップキャッシュと、より複雑な連想マップキャッシュがあります。一部のコードで 2 つの情報が必要であるにもかかわらず、2 つのアドレスがまったく同じキャッシュラインにマップされるというケースは避けたいと考えています。

c - CPU キャッシュとキャッシュ ラインについて

3 に答える 3

Related

Reference

c - CPU キャッシュとキャッシュラインについて