FFTW (FFT ライブラリ) のスレッド化されたバージョンを使用して、デュアル CPU マシンで一部のコードを高速化しようとしています。これは、スレッドが 1 つだけの時間の出力です。
131.838u 1.979s 2:13.91 99.9%
ここに2つのスレッドがあります:
166.261u 30.392s 1:52.67 174.5%
ユーザー時間と CPU 負荷のパーセンテージは、かなり効果的にスレッド化されていることを示しているようですが、ウォールクロック時間 (これは私が本当に気にかけていることです) は、スレッドを処理するのに約 28 秒余分にかかっていることを示しています (私はそう思います)。 . それは状況を説明する正確な方法ですか?もしそうなら、それはかなり正常ですか、それとも何かが間違って設定されている可能性がありますか? 光をありがとう。