一般的な知恵は、同じ操作を実行する場合よりも(または64ビットで)rep movsb
はるかに遅いことです。ただし、私はいくつかの最新のマシンでテストしており、実行時間は、膨大な範囲のバッファー サイズ (10 バイトから 2 メガバイト) にわたって (測定ノイズまで) 同一であることがわかりました。これまでのところ、2 台のマシン (32 ビット Intel Atom D510 と 64 ビット AMD FX 8120) でテストしました。rep movsd
rep movsq
(または)
rep movsb
より遅い最新の x86 (32 ビットまたは 64 ビット) マシンはありますか?rep movsd
rep movsq
そうでない場合、違いが顕著だった最後のマシンは何ですか?
rep movsd
私は、使用するために、またはrep movsq
これを行う実際の利点がない場合に、メモリを整列されていない頭/尾と整列された中央に分割するために一連のテストをカーゴカルトすることを避けたいという観点から、この質問をしています...