Core 2 Duoプロセッサのプリフェッチ命令を使用した経験のある人はいますか?
一連のP4マシンで(標準?)プリフェッチセット(prefetchnta
、prefetcht1
など)を使用して成功しましたが、Core 2 Duoでコードを実行すると、prefetcht(i)
命令は何も実行せず、prefetchnta
命令は少ないようです。効果的。
パフォーマンスを評価するための私の基準は、ベクトルサイズがキャッシュ外の動作に十分な大きさである場合の、BLAS 1ベクトル-ベクトル(axpy)操作のタイミング結果です。
Intelは新しいプリフェッチ命令を導入しましたか?