ループ内の C 構造体の巨大な配列で動作し、一部のデータを別の配列に格納する (アーム) インライン アセンブリ コードを書いています。
プロセッサは PLD プリフェッチ コマンドをサポートします。
連続した順序でデータにアクセスしている場合、現在の構造体の処理を開始する前に、プリフェッチ コマンドを使用して配列内の次の構造体の開始アドレスをロードすると、パフォーマンスが向上しますか? または、各反復で次のものをプリフェッチする必要がありますか? または、一定量のバイト先をプリフェッチしますか?
宛先配列のアドレスをプリフェッチすることも意味がありますか?
ありがとう!