いくつかの入力配列と結果配列を含む、パフォーマンスが重要な C/C++ コードを書かなければならないかもしれません (正確な型は気にしないでください)。特定の理由で、出力配列の小さなチャンクで作業し、入力に従ってそれらを変更したいのですが、キャッシュを信頼していないため (つまり、私は入力配列がそれを上書きするのではないかと心配し、実際にメモリの読み取りと書き込みを行うことになるのではないかと心配していました.これは恐ろしいことです.
- 小さいローカルの固定長配列をレジスタのみに格納することはできますか?
- どうすればこれを達成できますか?
- そのようなアレイはどのくらいの大きさにできますか (たとえば、Haswell または Skylake コア上で)?