線形配列を取得し、各要素を別の配列の任意の場所(CPUの観点からはランダムなど)に書き込むことで、プログラムを最適化することを考えています。私は単純な書き込みのみを行っており、要素を読み戻すことはしていません。
従来のCPUのスキャット読み取りは、アクセスごとにキャッシュミスが発生し、プロセッサが待機するため、非常に遅くなる可能性があることを理解しています。しかし、プロセッサが結果を待機していないため、分散書き込みは技術的に高速である可能性があると考えていました。したがって、トランザクションが完了するのを待つ必要がない場合があります。
残念ながら、私は従来のCPUメモリアーキテクチャのすべての詳細に精通していないため、これも非常に遅くなる可能性のあるいくつかの問題が発生する可能性があります。
誰かがこれを試しましたか?
(私は自分が抱えている問題を逆転させようとしていると言わなければなりません。現在、任意の値を読み取る線形配列(分散読み取り)があり、すべてのキャッシュミスのために非常に遅いです。私の考えはこの操作を分散書き込みに反転して、速度を大幅に向上させることができます。)