ARM ARMは、実際にはこの命令の適切な使用方法をあまり示していませんが、次の値を読み取る場所のヒントとしてアドレスを使用することを知っている他の場所で使用されていることがわかりました。
私の質問は、命令の256バイトのタイトなコピーループldm/stm
、たとえばr4-r11 x 8が与えられた場合、コピーの前、各命令ペアの間で各キャッシュラインをプリフェッチするか、またはのようにまったく実行しない方がよいかどうかですmemcpy
。問題は、メモリの同じ領域の読み取りと書き込みの両方ではありません。キャッシュラインのサイズが64バイトであることは確かですが、32バイトの可能性があります。ここで最終的なコードを記述する前に、確認を待っています。