0

私は科学的なコードを開発しているので、もちろん速度が重要です。移植性は実際には問題にならないので、プログラムをコンパイルするときに使用可能な openmp スレッドの数がわかっています。この情報を使用して、追加の最適化を実行できますか? はいの場合、どうすればよいですか?

この質問は非常に広いことが指摘されていたので。私はそれを少し自動化、つまりコンパイラーの最適化に減らしたいと思っています。したがって、コンパイラフラグまたは同様のものを設定します。

乾杯

-A

4

1 に答える 1

0

n 個の独立した領域 (n=スレッド数) に分割できるようにコードを変更できます。セクションの使用を優先する必要があります。プロセッサ間の通信が減少するため、並列 for ループと比較して高速化が向上します。

于 2012-05-07T08:04:51.420 に答える