9

などのプリフェッチ関連の機能をマスターすることに興味があります。

_mm_prefetch(...)

そのため、配列をループする操作を実行すると、メモリ帯域幅が完全に利用されます。これについて学ぶための最良のリソースは何ですか?

Intel Linux プラットフォームで GCC 4 シリーズを使用して C でこの作業を行っています。

4

2 に答える 2

11

Ulrich Drepper による優れた論文、What Every Programmer Should Know About Memoryもあります。彼は、プリフェッチに加えて、メモリ パフォーマンスの最適化を扱う他の多くのトピックをカバーしています。これは 2007 年 11 月にリリースされたもので、今日のプロセッサに非常に適しています。非常に大きな配列で操作を実行していて、ボトルネックがメモリに到達していると思われる場合は、それを読む必要があります。

于 2008-10-29T03:47:42.627 に答える
4

このサイトには、プリフェッチ オプションや機能を含む gcc プリフェッチ サポートの詳細と、Intel を含むいくつかのアーキテクチャの詳細が含まれています。gccマニュアル__builtin_prefetchには、セクション 5.46の組み込み関数の詳細が含まれています。

于 2008-10-29T01:56:06.580 に答える