ローカル メモリは、スレッドごとに 2 つのタイプであるレジスタ メモリよりも遅いというコメントしか見つかりませんでした。
共有メモリは高速であるはずですが、[スレッドの] ローカル メモリよりも高速ですか?
私がやりたいのは、メディアン フィルターのようなものですが、メディアンの代わりに特定のパーセンタイルを使用します。したがって、リストのチャンクを取得してソートし、適切なものを選択する必要があります。しかし、共有メモリ リストの並べ替えを開始できないか、問題が発生します。ローカル メモリにコピーするだけでパフォーマンスが大幅に低下しますか?