“cpu-cache”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

419 参照

tlb - Intel プロセッサは TLB の無効化を遅らせることができますか?

これは、インテルのソフトウェア開発者マニュアル (注文番号: 325384-039US 2011 年 5 月) を参照して、セクション 4.10.4.4「無効化の遅延」で、TLB エントリの無効化の潜在的な遅延について説明しています。変更されました。

ソフトウェア開発者は、ページング構造エントリの変更とセクション4.10.4.2で推奨されている無効化命令の実行の間に、プロセッサが使用する可能性があることを理解する必要があります。ページング構造エントリの古い値または新しい値のいずれかに基づく変換. 次の項目は、遅延無効化の潜在的な結果のいくつかを説明しています: ページング構造エントリが変更され、R/W フラグが 0 から変更された場合1 にすると、このエントリによって変換が制御されるリニアアドレスへの書き込みアクセスで、ページフォールト例外が発生する場合と発生しない場合があります。 "

線形アドレスのページ構造エントリが変更され (r/w フラグが 0 から 1 に反転)、その後、対応する TBL 無効化命令がすぐに呼び出される単純なケースを考えてみましょう。私の質問は、TLB の無効化の遅延の結果として、TLB の無効化を呼び出した後でも、問題の線形アドレスへの書き込みアクセスが失敗しない可能性があるということです (ページフォールト)。

または、「遅延無効化」は、ページ構造が変更された線形アドレスの「無効化」命令が発行されていない場合にのみ、予測できない結果を引き起こす可能性がありますか?

2011-07-28T12:03:06.367

0 投票する

1 に答える

436 参照

java - Synchronizedキーワードを使用するときのように、CyclicBarrierまたはCountDownLatchでキャッシュフラッシュ

CyclicBarrier または CountDownLatch が Synchronized キーワードを使用せずに続行できるようにする前に、Java が実行された書き込みのキャッシュを確実にフラッシュする方法はありますか?

java multithreading cpu-cache

2011-09-20T23:56:05.687

0 投票する

4 に答える

22138 参照

caching - 参照の局所性とは何ですか?

参照の局所性を理解するのに問題があります。誰でも、それが何を意味し、何が何であるかを理解するのを手伝ってくれませんか?

基準の空間的局所性
参照の時間的場所

caching memory cpu-architecture cpu-cache

user379888

2011-10-03T18:12:29.660

0 投票する

0 に答える

983 参照

linux-kernel - キャッシュ無効化後の mcr 命令

arm をプラットフォーム、Linux を使用する OS と考えてください。

カーネル構成で CONFIG_CPU_DCACHE_DISABLE を有効にすることにより、キャッシュが無効になっていることを考慮してください。このオプションは、基本的に L1 キャッシュを無効にします。L1キャッシュを無効にすると、明らかにL2キャッシュが無効になりますか?

これ以降、mcr 命令はキャッシュに影響を与えません。これは、dma_cache_maint() 操作が NULL と同等であることを意味しますか?

リンク: http://lxr.linux.no/#linux+v2.6.35/arch/arm/kernel/head.S#L166

linux-kernel arm linux-device-driver cpu-cache

2011-10-04T13:57:56.597

0 投票する

1 に答える

887 参照

hibernate - Hibernate は、リスト内の主キーで検索し、L2 キャッシュに直接送信します

単純な長い主キーを持つエンティティがあります。私は次のようなクエリを実行します: Select from table where primary_key IN (....);

Hibernate はクエリを実行して Id (指定したばかりです!) を取得し、L2 キャッシュに移動するようです。最初のクエリをスキップする方法はありますか? 主キーによる一連のエンティティが必要です。これが JPA 1 なのか JPA 2.0 なのか (Lists をより適切にサポートする) は不明です。

ループで findById() を実行して目的の結果を得ることができますが、これは明らかに最適ではありません。

hibernate jpa primary-key cpu-cache

2011-10-14T19:03:24.143

0 投票する

1 に答える

186 参照

c - ベンチマーク機能は複数回-最初以降のすべての呼び出しは命令キャッシュされますか？

単一の関数のベンチマークに使用される小さなベンチマークライブラリをCで作成しています。voidそれが機能する方法は、パラメーターと反復回数のない関数へのポインターをベンチマーク関数に提供することです。次に、関数は次のstruct情報を含むを返します。

ただし、個々の結果を見ると、最初の呼び出しに多くの時間がかかり、その後の呼び出しにかかる時間はごくわずかであることがわかります。

だから私は疑問に思っています：

これは命令キャッシュによるものですか？
最初の質問に「はい」の場合、ベンチマークツールは一般的にこれにどのように準拠していますか？最初の呼び出しは除外されますか？
最初の質問に「はい」の場合、キャッシュが関数に適用されない場合はありますか？
最初の質問に「はい」の場合、キャッシュは関数全体または関数のセグメントで発生しますか？
最初の質問に「はい」の場合、他に何か読んで理解を深める必要があると考えるべきことはありますか？

データとコード

時間を取得する関数：

テスト結果：

フラグを最適化しない場合の結果：

この結果を生成するテスト中の関数：

ファイルを作成します。

すべてのコードを含むGithubリポジトリ：

https://github.com/Ancide/TinyBench

編集：コンパイラとコンパイラフラグについて言及するのを忘れた

編集2：誰かがすべてを見たい場合に備えて、すべてのコードを含むgitリポジトリを追加しました

編集3：O2フラグなしで結果を追加

c benchmarking cpu-cache

2011-10-19T10:09:24.380

0 投票する

2 に答える

1662 参照

c++ - CPUキャッシュはC++/Cプログラミングを認識します

私はCPUキャッシュに関するScottMeyerのポッドキャストを調べていましたが、なぜ気にするのかこれによりコードの実行が速くなるようです。参照用にそのようなコーディングが行われているオープンソースはありますか。または、誰もがに基づいたデータ構造/アルゴリズムの設計の例を持っていますCPU caches aware

c++c algorithm data-structures cpu-cache

2011-10-31T07:52:00.193

0 投票する

2 に答える

48094 参照

operating-system - キャッシュにおける「ブロックサイズ」の概念

ダイレクトマップとセットアソシエイティブキャッシュの概念を学び始めたところです。非常に初歩的な疑問がいくつかあります。ここに行きます。

アドレスの長さが 32 ビットで、64 バイトのブロックサイズと 512 フレームの 32 KB のキャッシュがあるとすると、「ブロック」内に実際に格納されるデータの量は? メモリロケーションの値からロードする命令があり、その値が 16 ビット整数である場合、64 バイトブロックの 1 つが 16 ビット (2 バイト) 整数値のみを格納するようになりました。ブロック内の他の 62 バイトは? 16ビット整数値もロードする別のロード命令がある場合、この値はロードアドレスに応じて別のフレームの別のブロックに入ります(アドレスが前の命令の同じフレームにマップされている場合、前の値は削除されます)ブロックは再び 64 バイトで 2 バイトのみを格納します)。正しい？

これが非常にばかげた疑いのように思われる場合は、ご容赦ください。私の概念を正しく理解したいだけです。

operating-system cpu-cache

2011-11-12T22:13:05.673

0 投票する

3 に答える

34367 参照

optimization - すべてのプログラマーがメモリについて知っておくべきことは?

2007 年に出版された Ulrich Drepper のWhat Every Programmer Should Know About Memoryのどれだけが今でも有効なのか疑問に思っています。また、1.0 よりも新しいバージョンやエラッタも見つかりませんでした。

(また、Ulrich Drepper 自身のサイトの PDF 形式: https://www.akkadia.org/drepper/cpumemory.pdf )

optimization memory x86 cpu-architecture cpu-cache

2011-11-14T18:30:09.493

0 投票する

1 に答える

4843 参照

tags - CPUキャッシュのタグ、インデックスフィールドのビット単位のサイズを計算する方法は?

キャッシュのサイズ (バイト単位)、各キャッシュラインの長さ (バイト単位)、およびキャッシュ内のセット/グループの数を取得する CPU キャッシュエミュレーターを作成しています。

私はそのほとんどを書きましたが、何時間も苦労してきたのは、指定されたアドレスのタグとインデックスフィールドを抽出するために左/右にシフトする必要があるビット数を把握することです。

たとえば、アドレスが48の場合、タグとインデックスを特定する必要があります。

タグを抽出するために私が持っているものは次のとおりですが、それは間違っていると確信しています。

tags indexing bit-manipulation cpu-cache

2011-11-21T16:26:47.607

問題タブ [cpu-cache]

データとコード

Reference