caching - openMP チャンクとキャッシュサイズ

翻译自：https://stackoverflow.com/questions/17164439 2013-06-18T08:47:56.920

771 次

行列の乗算を実行する単純な Fortran コードがあり、このように OpenMP で並列化されています

!$OMP PARALLEL DO PRIVATE(...) SHARED(...) SCHEDULE(STATIC,N/128)

チャンクサイズを比較的大きくし、チャンク数をプロセッサ数の倍数 (4、8、16 など) にします。

ただし、行列のサイズが非常に大きくなった場合は、チャンクサイズをキャッシュサイズよりも小さく設定する方が理にかなっているようです (少なくとも、試してみる価値はあります)。プロセッサのキャッシュサイズを考慮した移植可能なコードを作成する簡単な方法はありますか? または、OpenMP でサポートされていませんか?

caching - openMP チャンクとキャッシュ サイズ

1 に答える 1

Related

Reference

caching - openMP チャンクとキャッシュサイズ