一般的な知恵は、同じ操作を実行する場合よりも(または64ビットで)rep movsbはるかに遅いことです。ただし、私はいくつかの最新のマシンでテストしており、実行時間は、膨大な範囲のバッファー サイズ (10 バイトから 2 メガバイト) にわたって (測定ノイズまで) 同一であることがわかりました。これまでのところ、2 台のマシン (32 ビット Intel Atom D510 と 64 ビット AMD FX 8120) でテストしました。rep movsdrep movsq
(または)
rep movsbより遅い最新の x86 (32 ビットまたは 64 ビット) マシンはありますか?rep movsdrep movsqそうでない場合、違いが顕著だった最後のマシンは何ですか?
rep movsd私は、使用するために、またはrep movsqこれを行う実際の利点がない場合に、メモリを整列されていない頭/尾と整列された中央に分割するために一連のテストをカーゴカルトすることを避けたいという観点から、この質問をしています...