c - なぜCのdoubleが8バイト整列されているのですか？

Question

メモリ内のデータ型の配置に関する記事を読んでいましたが（ここ）、1つのポイントを理解できません。

ダブル変数は32ビットマシンの8バイト境界に割り当てられ、2つのメモリ読み取りサイクルが必要であることに注意してください。64ビットマシンでは、バンク数に基づいて、double変数が8バイト境界に割り当てられ、必要なメモリ読み取りサイクルは1つだけです。

私の疑問は、なぜダブル変数を4バイトではなく8バイト境界に割り当てる必要があるのかということです。それが4バイト境界に割り当てられている場合でも、必要なメモリ読み取りサイクルは2回だけです（32ビットマシンの場合）。私が間違っている場合は私を訂正してください。

また、誰かがメンバー/メモリの配置に関する優れたチュートリアルを持っている場合は、親切に共有してください。

score 19 · Accepted Answer

サイズ 2^N のデータ値を 2^N の境界に揃える理由は、値がキャッシュラインの境界を越えて分割される可能性を回避するためです。

x86-32 プロセッサは、最大 2 回の 32 ビットメモリ読み取りで、任意のワード境界 (8 バイトアラインされているかどうかに関係なく) から double をフェッチできます。ただし、値がキャッシュラインの境界を越えて分割されている場合は、メモリから 2 番目のキャッシュラインをフェッチする必要があるため、2 番目のワードをフェッチする時間が非常に長くなる可能性があります。これにより、プロセッサのパフォーマンスが不必要に低下します。(実際問題として、現在のプロセッサはメモリから一度に 32 ビットをフェッチしません。非常に広いデータ帯域幅を有効にするために、はるかに広いバスでより大きな値をフェッチする傾向があります。両方のワードをフェッチする実際の時間は、同じキャッシュラインにあり、すでにキャッシュされている場合は、わずか 1 クロックである可能性があります)。

この配置スキームの自由な結果は、そのような値もページ境界を越えないことです。これにより、データフェッチ中にページフォールトが発生する可能性が回避されます。

したがって、パフォーマンス上の理由から、double は 8 バイト境界に揃える必要があります。そして、コンパイラはこれを知っており、あなたのためにそれを行います.

score 3 · Accepted Answer

値をそのサイズよりも低い境界に揃えると、2 つのキャッシュラインにまたがって分割されやすくなります。値を 2 つのキャッシュラインに分割すると、キャッシュラインをバッキングストアに削除する際に余分な作業が発生し (1 つではなく 2 つのキャッシュラインが削除されます)、メモリバスに無駄な負荷がかかります。

score 1 · Accepted Answer

8 byte alignment for double on 32 bit architecture doesn't reduce memory reads but it still improve performance of the system in terms of reduced cache access. Please read the following : https://stackoverflow.com/a/21220331/5038027

score -2 · Accepted Answer

倍精度浮動小数点形式については、この wiki 記事を参照してください。

メモリサイクルの数は、RAM バンクの数を決定するハードウェアアーキテクチャによって異なります。32 ビットアーキテクチャと 4 つの RAM バンクを使用している場合、読み取りに必要なメモリサイクルは 2 つだけです (各 RAM バンクは 1 バイトを提供します)。

c - なぜCのdoubleが8バイト整列されているのですか？

4 に答える 4

Related

Reference