linux - Linux (x86) のページサイズが 4 KB なのはなぜですか? それはどのように計算されますか?

Question

x86 アーキテクチャー上の Linux カーネルのデフォルトのメモリー・ページ・サイズは 4 KB でしたが、それはどのように計算されたのでしょうか? またその理由は?

score 45 · Accepted Answer

デフォルトのページサイズは、CPU の MMU (メモリ管理ユニット) がサポートするものによって決まります。32 ビットプロテクトモードでは、x86 は次の 2 種類のページをサポートします。

通常のもの、4 KiB
巨大なもの、4 MiB

すべての x86 プロセッサがラージページをサポートしているわけではありません。Page Size Extension (PSE) 機能を備えた CPU が必要です。これには、Pentium より前のプロセッサは含まれません。事実上、現世代のすべての x86 CPU がそれを実装しています。

4 KiB は、他のアーキテクチャでも広く普及しているページ粒度です。このサイズは、32 ビットの仮想アドレスをページディレクトリ/テーブル内の 2 つの 10 ビットインデックスに分割し、残りの 12 ビットで 4 KiB のページサイズになると主張できます。

score 26 · Accepted Answer

32 ビットアーキテクチャの 4KB の通常ページサイズの設計は、実際には非常に興味深いものです :)

そして、それが合理的である理由を示すために、追加の回答を追加したいと思います。

x86 は「2 レベルページテーブル」を使用して、仮想メモリアドレスを物理メモリアドレスに変換します。

したがって、ページディレクトリとページテーブルの両方にここに画像の説明を入力エントリが含まれ、ページサイズがバイトであるとします。アドレスを最大限に活用するために、次のものがあります。

ここに画像の説明を入力

ページディレクトリ/テーブルの各エントリは 4 バイト (32 ビット) を消費するため、次のようになります。

ここに画像の説明を入力

したがって、y = 12 で、バイト単位のページサイズはここに画像の説明を入力 = = 4KB になります。

では、「1 レベルのページテーブル」はどうでしょうか。これは興味深いことです。論理的には、アドレスルックアップに 1 つのページテーブルを使用できるからです。

ここに画像の説明を入力ページディレクトリにエントリが含まれ、それぞれがアドレスを対応するページにマッピングし、ページサイズがバイトであると仮定します。

ここに画像の説明を入力繰り返しますが、アドレスを最大限に活用するには、次のものが必要です。

ここに画像の説明を入力

と：

ここに画像の説明を入力

y = 17 となり、ページサイズはここに画像の説明を入力 = = 128KB です。

また、「2 レベルページテーブル」バージョンでは、ページディレクトリとページテーブルのサイズが異なる可能性があると主張する場合もあります。ただし、これは、複数のメモリページを占有するより大きなページディレクトリを使用することを意味します。悲しいことに、新しいユーザープロセスが生成されるたびに、独自のページディレクトリに対して OS が連続するページを割り当てる必要がありますが、これは設計上エレガントではありません。

score 18 · Accepted Answer

序章

ページング仮想メモリ技術をサポートした最初の Intel プロセッサは、Intel 80386でした。プロセッサは、4 KB の単一ページサイズをサポートしていました。1985 年にリリースされて以来、Intel がその特定のページサイズを選択した理由を理解するには、その時期にさかのぼる必要があります。

Atlasは、ページサイズが 3 KB のページングをサポートする最初のコンピューターであり、仮想メモリの設計に大きな影響を与え、関連する研究を動機付けました。このシステムは 1958 年から 1962 年にかけて設計されました。興味深いことに、80386 が設計されたのは約 20 年後であり、コンピューター (およびそれらが実行するワークロード) はその期間中に根本的に進化しましたが、80386 がサポートするページサイズは Atlas がサポートするページサイズにいくらか近いことに注意してください。時間！実際、その時代の多くのコンピューターは、0.5 ～ 5 KB の範囲のページサイズを使用していました。当時の研究者は、仮想メモリシステム (ページングとセグメンテーション) の研究にかなりの労力を費やしました。

大きな疑問の 1 つは、最適なページサイズはどれくらいかということでした。60 年代と 70 年代には、ページサイズがアプリケーションのパフォーマンスに与える影響を調査および理解し、ページサイズの選択方法に関するガイドラインを推奨または提供しようとする多数の著作が公開されました。出版されなかった論文は確かにたくさんあります。私の知る限り、これには Intel からの「... したがって、ページサイズは 4 KB にする必要があります」という文書が含まれています。しかし、ページサイズとページサイズ (または複数のページサイズ) を選択するプロセスに影響または相互作用する要因はよく知られているため、この回答で基本的なレベルで説明します。また、4 KB のページサイズが妥当である理由についても特に説明します。

ページサイズの問題

ページング方式では、物理メモリはページフレームと呼ばれる同じサイズのメモリの連続した領域のシーケンスとして編成されます (これがページングの特徴です¹ )。各ページフレームは、仮想ページと呼ばれる仮想アドレス空間の同じサイズのチャンクにマップできます。

Nページがバイト²で構成されていると仮定し(これは、ページフレームNのサイズも定義によりバイトであることを意味します)、ページで構成される仮想アドレス空間を考えPます (つまり、ページ番号は {0, 1, 2, ... です)。 , P- 1} であり、仮想アドレスの総数はN* P) です。また、物理アドレス空間がFページフレームで構成されているとします (つまり、ページフレーム番号は {0, 1, 2, ..., F- 1} であり、物理アドレスの総数はN*Fです)。

仮想アドレスが与えられた場合、物理アドレスを決定するVAメカニズム (マッピングデバイスPA) が必要です。マッピング先であるか、マッピングされていない場合はページフォールトを発生させる必要があります。マッピングデバイスは、どこかに保存されているデータ構造 (ページテーブル) を使用してマッピングを実行します。割り当てられた仮想ページごとに、ページがどのようにマップされているか、および場合によってはいくつかの追加属性 (保護属性など) を説明するエントリが、そのテーブルに存在する必要があります。ご覧のとおり、ページテーブルエントリの設計は、ページサイズと相互作用します。Intel 80386 のページテーブルエントリの設計については後で説明します。

仮想アドレスのサイズは log ₂ ( N* P) で、物理アドレスのサイズは log ₂ ( N* F) です。一部のビットはVAページ内のオフセットを表し、他のビットはページ番号を表し、マッピングデバイスを使用してページを識別します。

ページサイズにはいくつのオプションがありますか? まあ、それはN*PまたはN*Fのいずれか小さい方までの 1 バイトからなる可能性があります。それは多くのオプションです。

ページサイズは2のべき乗が便利

仮想アドレスはVA、ページ番号とオフセットのペア ( PN、OFF) に相当します。翻訳プロセスは可能な限り効率的である必要があります。ページ内のバイトがアドレス空間内で連続していると、プログラマー³にとって便利です。このように、マルチバイトデータ構造内の項目のアドレスは、データ構造のベースアドレスを構成する単一のアドレスに対する単純な算術演算で計算できます。これは、仮想アドレスの最下位 log ₂ ( N) ビット (切り上げ) を使用してオフセットを表し、残りのビットを使用してページ番号を表すことによって実現できます。

が 2 の累乗でない場合N、これらのビットの値に応じて、オフセットとページ番号の間で共有されるビットがいくつかあります。2の累乗にすることNで、そのような複雑さはありません。そのため、2 のべき乗であるページサイズを使用するのが適切です。ページングをサポートするすべての実際のプロセッサは、2 のべき乗であるページサイズを使用します (ただし、アドレス指定可能性の単位は 8 ビットではない場合があります)。これは理にかなっています。しかし、正直なところ、これが本当に重要かどうかは明らかではありません。今日のテクノロジーを使用するかどうかに関係なく、Nは 2 の累乗であり、パフォーマンスやその他の関心のあるメトリックに測定可能な影響を与えない場合があります。実際、将来、ますます大きなページサイズが必要になると、2 の累乗ではないページサイズの方が優れている場合があります。しかし、これまでのところ、これは起こっていません。ここで強調したいのは、ページサイズを 2 のべき乗にしないという設計オプションを自動的に無視してはならないということです。これは、将来の仮想記憶システムを研究する良い機会になると思います。

とにかく、4 KB ページの選択が 80 年代に行われたことを念頭に置くと、ページサイズのこのような非常に小さな変動は (理論的にも実験的にも) ほとんど重要ではないことが示されました。そのため、2 の累乗のページサイズの利便性が勝ったのです。これにより、考慮すべきページサイズの数が指数関数的に減少します。しかし、私たちにはまだ幅広い選択肢があります。

小さいページサイズを優先する

マッピング・デバイスはページのレベルで機能するため、オペレーティング・システムから見た割り当ての単位は仮想ページ⁴です。アプリケーションが 1 バイトだけを割り当てる必要がある場合でも、その 1 バイトに仮想ページ全体を割り当てるよう OS に指示する必要があります。この問題は内部フラグメンテーションと呼ばれます. 各アプリケーション (またはアプリケーションの各コンポーネント) には、ページサイズのチャンクでメモリを割り当てる独自の仮想アドレス空間があります。各アプリケーションは、割り当てる単一のオブジェクトに対して単一のページを使用するのではなく、同じページからできるだけ多くのオブジェクトを割り当ててから、より多くのページを割り当てることが期待されます。ただし、ページ属性はページのレベルで機能するため、同じアプリケーションが複数のユーザーモードメモリマネージャーを使用する可能性があり (複数の C/C++ ランタイムを使用する場合など)、アプリケーションが使用していないページの一部を共有することは困難です。他のアプリケーションでは、システム内の多くのページで内部断片化が発生する可能性があります。小さいページサイズを使用すると、物理 (システム全体) および仮想 (プロセスごと) メモリの無駄な量を減らすことができます。

さらに、通常、アプリケーションはその存続期間中にさまざまなフェーズを経て、さまざまなフェーズでさまざまなメモリ要件を示します。たとえば、ページサイズが 16 KB であるが、多くのアプリケーションが多くのフェーズで 10 KB 未満しか必要としない場合、物理メモリが大量に浪費され、メモリ不足の状況につながる可能性があります。 8 または 4 KB などの小さいページサイズがサポートされている場合は回避されます。

コピーオンライトのソフトページフォールトを処理するには、ページサイズが小さい方が適しています。ページが小さいほど、そのコピーの作成にかかる時間が短くなるからです。ページサイズが非常に小さい場合、メモリバスの帯域幅によっては、測定可能な違いが生じない場合があります。

1970 年代のコンピューターで使用可能な物理メモリの一般的な量は、数十から数百キロバイトの範囲でした。数百 KB 以上のページサイズは意味がありません。実際、当時のアプリケーションのワーキングセットは通常、数キロバイトから数十キロバイトしかありませんでした。そのため、わずか 16 KB のページサイズでも実用的ではない可能性があります。ページサイズは、物理メモリの量と一致している必要があります。もちろん、この議論は今日のシステムにも当てはまります (たとえば、128 GB のページを使用しても意味がありません)。

したがって、 70 年代から 80 年代前半のワーキングセットのサイズと物理メモリの可用性を考慮すると、ページサイズは 2 ⁰ ～ 2 ¹⁴の範囲の 2 の累乗でなければなりません。これで、選択できるオプションは 15 個だけになりました。

より大きなページサイズを優先する

また、ページサイズが大きいほど優れていると主張することもできます。同じワーキングセットの場合、ページサイズが小さいほど、アプリケーションあたりのページ数が多くなり、変換を有効にするためにページテーブルエントリが必要になります。これには基本的に、ページテーブルの構造に関係なく、より大きなページテーブルが必要です (ただし、正確なオーバーヘッドはページテーブルエントリ自体の設計に依存しますが、これについては後で説明します)。たとえば、4 バイトのページと数十 KB の典型的なワーキングセットがあるとします。その場合、物理メモリのほとんどは実際には、データではなくページテーブルを保持するために割り当てられます。ページテーブルをセカンダリストレージにページアウトすると、個々のメモリ参照で二重のページフォールトが発生し、パフォーマンスが大幅に低下します。そのようなデザインは明らかにばかげています。

基本的に、ページサイズは、これまでに可能な最小のワーキングセットサイズよりも (大幅に) 小さくするべきではありません。^{これにより、サイズ 2 0} -2 ⁶のページがすぐに除外され、8 つのオプションが残ります。70 年代と 80 年代初頭のページサイズを研究した論文は、ほとんどの場合、これら 8 つのオプションのみを研究しています。

ページサイズを大きくすると有利になる別の理由があります。仮想メモリの利点の 1 つは、メインメモリに加えてセカンダリストレージを透過的に使用して揮発性データを保持できることです。ただし、セカンダリストレージデバイスは機械的なものであり、バルク転送で最高のパフォーマンスを発揮します。これは実際にはガイドラインであり、まだページサイズを除外するべきではありません。さまざまな設計と特性を持つデバイスがあり、最終的には、バルク転送のパフォーマンス上の利点はある時点で飽和します。しかし、ページサイズがパフォーマンスに与える影響を測定する際には、これを考慮に入れる必要があります。考慮されているアプリケーションのタイプが空間的局所性をほとんど示さない場合でも、ディスクとの間で余分なバイトをコピーするのは必ずしも無料ではないため、小さいページサイズが望ましいでしょう。

参照の空間的局所性により、特定のページサイズの使用が促進されます。ページサイズが非常に小さい場合、ページ内のすべてのバイトが短時間で使用される可能性が高くなります。ページのサイズが大きくなるにつれて、使用される可能性が低いバイト数が増加します。ただし、非常に大きなページの場合、局所性に関係なく、すべてのワーキングセットが少数のページに収まる場合があります。したがって、ページフォールトの数を最小限に抑えるには、ページサイズが小さすぎるか大きすぎる必要がありますが、その中間ではありません。しかし、最終的には、これはアプリケーションごとに異なります。オブジェクト指向プログラミングや関数型プログラミングなどの新しいプログラミングパラダイムまた、マルチスレッドなどの手法は、リンクされた構造の広範な使用と、さまざまなアプリケーションが互いに相互作用する方法により、実際には空間的局所性を低下させる可能性があります。ページフォールトの数を減らすには、ページサイズを大きくすることをお勧めします。ただし、共有ページの内部断片化を減らすために、複数のアプリケーション間で共有されるメモリには小さいページサイズが適している場合があります。また、メインメモリに保持できるページフレームの数がページフォールトの数と相関し、ページサイズが小さいほど好ましいことが実験的に示されています。

当時、TLB の必要性は十分に認識されていました。Intel はそれらを特許でページキャッシュと呼んでいました (Intel が最初にその用語を使用したかどうかは不明です)。アドレス変換は命令実行のクリティカルパス上にあるため、高速 TLB は非常に重要です。可能な限り高速にするには、サイズを小さくする必要がありますが、キャッシュできるのは少数のページテーブルエントリのみです。これにより、より大きなページサイズを使用するようになります。

最適なページサイズを検索すると、最適なページサイズがないことが判明しました。その時点で、複数のページサイズをサポートする必要があることが知られていました。実際、1965 年に設計された Multics システムは、64 または 1,024 ワードのページ (1 ワードは 36 ビットサイズ) をサポートしていました。^{2 7}から2 ¹⁴の範囲のページサイズが、さまざまなシナリオで経験的にも理論的にも最適であることが示されました。Intel は、顧客が 80 年代に使用していたアプリケーションの平均パフォーマンスが最高になるのは 4 KB ページであることを認識していたに違いありません。今日のコンピューターとアプリケーションでは、70 年代と 80 年代のようにページサイズがわずかに異なっていても、それほど大きな違いはありません。

Intel 80386 のページテーブルエントリの設計

ページディレクトリエントリとページテーブルエントリの設計については、Intel の特許で詳しく説明されています。ページテーブルエントリのサイズとページテーブルの全体的な構造は、ページサイズに関する多くの研究で考慮されているため、これは重要です。答えを短くするために、これについてこれ以上詳しく説明することは避けたいと思います。

近未来のページサイズ

Intel は数か月前に、デフォルトのページサイズが 64 KB であると同時に、下位互換性のために 4 KB ページ (およびその他の IA-32e ページサイズ) をサポートするシステムを明らかに提案する特許を取得しました。私は特許から引用します：

64 KB ページの 4 KB サブページへのマッピングのサポートの結果として、VA64 は、4 KB ページごとの独立した保護ビットおよび任意の 4 KB 整列アドレスマッピングを含む、4 KB ページで現在定義されているすべての操作を直接サポートします。VA64 は、OS カーネルが 64 KB 単位でメモリを割り当てる場合でも、4 KB 境界での OS カーネルページ管理もサポートします。ラージページのサポートの結果として、VA64 は、Intel Corporation の IA-32e ページングシステムなどの既存のページングシステムがサポートするページへの仮想アドレス範囲のすべての分割をサポートします。したがって、VA64 は、4 KB ページの Windows® OS カーネルで動作するアプリケーションとハードウェアデバイスをサポートすると同時に、64 KB ページを使用できる場合は 64 KB ページを最大限に活用します。

VA64 の機能は、第 1 世代の VA64 対応 OS カーネルですべてをサポートする必要はなく、OS カーネルによって徐々に採用されます。たとえば、VA64 対応の OS カーネルは、すべてのページを現在のサイズ (たとえば、Intel Corporation の IA-32e ページングシステムでは 4 KB/2 GB/1 TB) にマッピングすることから始めますが、新しいページテーブル形式に変更します。ページテーブル形式の変更後、OS カーネルを変更して仮想メモリを 64 KB 単位でマップし、64 KB ページを空きリストに格納するように変更できます。その後、OS カーネルは、アライメントと保護が許可されている場合はいつでも 64 KB ページの使用を開始し、他の VA64 機能のサポートを追加できます。

VA64 ページングシステムについては、特許に書かれていること以外は何も知りません。インターネットのどこにも何もありません。もっとすぐにわかると思います。

選択された参考文献

デニング、PJ（1970）。仮想メモリ。ACM Computing Surveys Volume 2 Issue 3、153-189。

Gelenbe、E.、Tiberio、P.、およびBoekhorst、JCA（1973）。デマンドページングシステムのページサイズ。Acta Informatica、3(1)、1-23。

Alanko, TO, & Verkamo, AI (1983). 仮想メモリ内のセグメンテーション、ページング、および最適なページサイズ。性能評価、3(1)、13-33。

Corbató、FJ、およびVyssotsky、VA（1965）。Multics システムの紹介と概要。1965 年 11 月 30 日から 12 月 1 日にかけて開催されたコンピューター会議の議事録、パート I (pp. 185-196)。

脚注

(1) 実際には、単一の仮想ページのサイズはページフレームのサイズの倍数になる可能性がありますが、そこには行きません。

(2) 定式化を一般化し、「ワード」という用語を使用して、バイトではなくメモリのアドレス指定可能な最小単位を指すことができますが、それはここでは重要ではありません。

(3) プログラミング言語によってはプログラマーではないかもしれませんが、コンパイラー、リンカー、アセンブラー、およびバイナリー・コードで動作するツール。

(4) ページングと非ページングの同時使用をサポートするシステムを設計することは確かに可能です。

score 12 · Accepted Answer

それはプロセッサのアーキテクチャに依存します。

多くのアーキテクチャでは、デフォルトのページサイズは 4 KB です。通常は、huge pageモードに切り替えることで増やすことができます (AMD64 の 1 GB のように、かなり大きくなる場合もあります)。これにより、ページテーブルが小さくなり、パフォーマンスが向上する可能性があります。

score 0 · Accepted Answer

ウィキペディアの記事からこれを入手し、引用します。

ページサイズは通常、プロセッサアーキテクチャによって決まります。

以下の記事をご覧ください。

http://en.wikipedia.org/wiki/Page_(computer_memory)

linux - Linux (x86) のページサイズが 4 KB なのはなぜですか? それはどのように計算されますか?

6 に答える 6

序章

ページサイズの問題

ページサイズは2のべき乗が便利

小さいページ サイズを優先する

より大きなページ サイズを優先する

Intel 80386 のページ テーブル エントリの設計

近未来のページサイズ

選択された参考文献

脚注

Related

Reference

小さいページサイズを優先する

より大きなページサイズを優先する

Intel 80386 のページテーブルエントリの設計