などのプリフェッチ関連の機能をマスターすることに興味があります。
_mm_prefetch(...)
そのため、配列をループする操作を実行すると、メモリ帯域幅が完全に利用されます。これについて学ぶための最良のリソースは何ですか?
Intel Linux プラットフォームで GCC 4 シリーズを使用して C でこの作業を行っています。
などのプリフェッチ関連の機能をマスターすることに興味があります。
_mm_prefetch(...)
そのため、配列をループする操作を実行すると、メモリ帯域幅が完全に利用されます。これについて学ぶための最良のリソースは何ですか?
Intel Linux プラットフォームで GCC 4 シリーズを使用して C でこの作業を行っています。
Ulrich Drepper による優れた論文、What Every Programmer Should Know About Memoryもあります。彼は、プリフェッチに加えて、メモリ パフォーマンスの最適化を扱う他の多くのトピックをカバーしています。これは 2007 年 11 月にリリースされたもので、今日のプロセッサに非常に適しています。非常に大きな配列で操作を実行していて、ボトルネックがメモリに到達していると思われる場合は、それを読む必要があります。