“tlb”の関連問題_Stack Overflow日本語サイト

0 投票する

0 に答える

337 参照

linux - flush_cache_range() と flush_tlb_range() が機能していないようです

これが私がしたことです：

ユーザー空間プロセスはmalloc()、ヒープにメモリを割り当て、特定の文字パターンで埋めてから、malloc().
プロセス ID とメモリチャンクのアドレスは、次のようなカーネルモジュールに渡されます。

}
(上記の変数定義の後のコードの 3 行目)によって引き起こされるページフォールトを追跡するために、Linux カーネルprintk()の関数にステートメントを追加しました。このようなもの：handle_mm_fault()target_process_id
/li>

さて、私が気付いたのは、最後のprintk()ステートメントが何もキャッチしていないことです。

関数init_moduleは、カーネルモジュールの初期化関数です。insmodを使用して実行中のカーネルに挿入されます...コマンドを使用してinsmod module.ko pid=<processId> addr=<address>

何がうまくいかないのでしょうか？

2014-01-24T17:20:42.480

0 投票する

2 に答える

127 参照

caching - 典型的なプログラムでのTLBとキャッシュの違いについて

通常、20% のメモリ命令があります。5% のデータ TLB ミスがあり、それぞれの処理に 100 サイクルが必要であると仮定します。各命令の実行に 1 サイクルが必要であり、キャッシュ内の各メモリ操作は 1 サイクルであり、データアクセスの 10% がキャッシュミスであると仮定します。各キャッシュミスは 15 サイクルなので、1000 命令を実行するのにかかる時間はどれくらいか。

答えはわかりませんが、TLB とキャッシュの両方が存在することに混乱しています。キャッシュと TLB は同じものであるという印象を受けましたか?

caching memory-management operating-system tlb

2014-02-08T18:14:44.640

0 投票する

2 に答える

1051 参照

assembly - 変換ルックアサイドバッファの書き込み

アプリケーションは仮想メモリで動作します。これは素晴らしいコンセプトです。連続したブロックのように扱うことができ、物理 RAM で連続しているかどうか、またはハードディスク上にあるかどうかを気にする必要はありません。

私が理解している限り、仮想アドレスと物理アドレス間のマッピングは、変換ルックアサイドバッファーを使用して CPU (または少なくともハードウェア) によって直接行われます。

カーネルがどうにかして TLB の内容を維持していると思いますが、ここで少し行き詰まっているので、3 つの質問があります。

TLB の内容を照会、読み取り、および書き込むための特定のアセンブラー命令は何ですか? このトピックに関連するオペコードをグーグルで検索したのは、あまり幸運ではありませんでした。INVLPG と TLBWI を見つけました。私はそのレベルの深さに慣れていないので、間違った検索用語を使用しているだけかもしれません. すぐに見つけた場合、どの検索語を使用しますか?

これらすべてのアセンブラ命令には、特権 CPU モードが必要ですか?

TLB の初期コンテンツは何ですか? TLB が最初に空の場合、それはオペレーティングシステムの最初のアセンブラー命令が物理メモリに直接マップされることを意味しますか (したがって、仮想アドレス == 物理アドレス)?

assembly x86 i386 tlb

2014-02-19T16:01:17.567

0 投票する

1 に答える

983 参照

MMU が 2 レベルのページテーブルをサポートする IA-32 システムを考えてみましょう。第 2 レベルには、4 KB ページフレームにマッピングされた 1024 ページテーブルエントリが含まれます。各ページテーブルエントリ (両方のレベル) のサイズは 4 バイトです。システムは 4 KB のページサイズのみをサポートします。
バイト 0 から始めて、連続する 8 MB を仮想メモリから順次読み取ります。一度に 1 ワード (4 バイト)
を読み取ります。8 エントリのデータ TLB があります。上記で指定された 8 MB のメモリを読み取るには、何回のメモリアクセスが必要ですか?

TLB に 8 つではなく 4 つのエントリがある場合、違いはありますか?

というわけで、順番に読んでいきます。これは、8MB/4B = 2M のメモリアクセスを意味します。2 レベルのページテーブルがあります。したがって、2M + 2*2M = 6M のメモリアクセスが TLB なしで行われます。

しかし、TLBを含むメモリアクセスを計算する方法がわかりません。

誰か私にそれを説明してもらえますか? それはとても役に立ちます。

memory paging tlb mmu

user2965601

2014-03-11T18:39:29.087

0 投票する

2 に答える

576 参照

memory-management - TLB ヒット - ページがプロセスのメモリ空間内にあるかどうかの確認

仮想アドレスから物理アドレスへの変換について読んでいます。TLB は、CPU のメモリ管理ユニットに常駐するハードウェアキャッシュであり、最近アクセスされたページのマッピングを含むことを理解しています。

ただし、TLB ヒットがあるとします。OS は、プロセスがページに実際にアクセスできる (プロセスに割り当てられたアドレス空間内にある) ことをどのように保証しますか?

それを行う1つの方法は、プロセスのページテーブルを確認することだと思いますが、それはTLBを使用する目的全体を無効にしているようです. 洞察はありますか？

memory-management operating-system tlb

2014-04-15T17:16:47.250

0 投票する

0 に答える

529 参照

linux - 「cpsie」アーム命令の場合、TLB はミスしますか?

プログラムのプロファイリングを行ったところ、「_raw_spin_unlock_irq」システムコールが ARM Cortex A15 ボードで多くの iTLB ミスを引き起こしていることがわかりました。アセンブリコードを注意深く確認したところ、"cpsie" 命令が原因の 1 つである可能性があることがわかりました。したがって、私は自分の仮定を検証するために短いコードをプログラムしました。

以下は私のコードです：

次に、perf ツールを使用して iTLB ミスを確認したところ、次のように報告されました。

89172 dTLB ロードミス

5694 dTLB ストアミス

43248 iTLB ロードミス

「cpsie i」命令を削除すると、結果は次のようになります。

23453 dTLB ロードミス

1453 dTLB ストアミス

12035 iTLB ロードミス

結果は、「cpsie i」が iTLB ミスの 4 倍に増加したことを示しています。パフォーマンスレポートを使用してバイナリコードに注釈を付けました。69.5% の iTLB ミスが "cpsie i" 命令の後に隣接して発生しました。

「cpsie i」命令の後に多くの iTLB ミスが発生したのはなぜですか? それを防ぐ方法はありますか？ありがとう！

linux arm kernel tlb perf

2014-05-02T09:10:09.043

0 投票する

1 に答える

518 参照

tlb - TLB のロックと無効化をチェックするテストを作成する方法は?

ソフトウェア MMU を検証しようとしています。

入手したテストケースでは、「TLB ロックと無効化」をチェックする必要があります。

テストを実行して TLB ミスをチェックしましたが、TLB ロックと無効化が正確に何を意味するのかを理解できませんでした。

tlb mmu

2014-05-20T12:14:28.120

問題タブ [tlb]

linux - flush_cache_range() と flush_tlb_range() が機能していないようです

caching - 典型的なプログラムでのTLBとキャッシュの違いについて

assembly - 変換ルックアサイドバッファの書き込み

memory - メモリ - ページングと TLB

memory-management - TLB ヒット - ページがプロセスのメモリ空間内にあるかどうかの確認

linux - 「cpsie」アーム命令の場合、TLB はミスしますか?

tlb - TLB のロックと無効化をチェックするテストを作成する方法は?

問題タブ [tlb]

Reference