パフォーマンスの低いアルゴリズムがあり、CPU キャッシュ ミスが原因であると考えられます。それにもかかわらず、それらを検出する方法がないため、それを証明することはできません. アルゴリズムが生成する CPU キャッシュ ミスの数を知る方法はありますか? それらを検出できる任意の言語に移植できます。
前もって感謝します。
この種の問題を見つける最も簡単な方法は、プロファイラーを使用してキャッシュ関連のパフォーマンス カウンターを収集することです。
次のツールを確認することをお勧めします。
アルゴリズムの全体的な構造を確認できますか (長すぎない場合)。
Intel CPU は、一部のアセンブラー命令で抽出できるパフォーマンス カウンターを保持します。
(1) 静止状態のシステムでのベースライン キャッシュ ミス、(2) プログラムを実行して比較していただけますか?
作成する必要があるアセンブラについては、 Intel Instruction Set Reference Section 18 Page 15 (18-15) のVolume 3B を参照してください。