私はこの質問とトップ投票の回答を参照しています:-
結合ループよりも個別のループの方が要素ごとの加算がはるかに高速なのはなぜですか?
私の質問は、特定の CPU がロード/ストアのアドレス エイリアシングに使用するビット数 (N と呼びます) を決定する簡単な方法はありますか?
私はこの質問とトップ投票の回答を参照しています:-
結合ループよりも個別のループの方が要素ごとの加算がはるかに高速なのはなぜですか?
私の質問は、特定の CPU がロード/ストアのアドレス エイリアシングに使用するビット数 (N と呼びます) を決定する簡単な方法はありますか?
OS レベル: いいえ。CPUキャッシュに対するユーザー空間の可視性を提供する標準OS API(LinuxまたはWin32のものを含む)を認識していません。
ただし、Intel は、低レベルのパフォーマンス分析と最適化のための優れたツールをいくつか提供しています。例えば、