1

私はこの質問とトップ投票の回答を参照しています:-

結合ループよりも個別のループの方が要素ごとの加算がはるかに高速なのはなぜですか?

私の質問は、特定の CPU がロード/ストアのアドレス エイリアシングに使用するビット数 (N と呼びます) を決定する簡単な方法はありますか?

4

1 に答える 1

0

OS レベル: いいえ。CPUキャッシュに対するユーザー空間の可視性を提供する標準OS API(LinuxまたはWin32のものを含む)を認識していません。

ただし、Intel は、低レベルのパフォーマンス分析と最適化のための優れたツールをいくつか提供しています。例えば、

于 2012-05-23T22:16:07.117 に答える