次の恥ずかしい並列ループがあります
//#pragma omp parallel for
for(i=0; i<tot; i++)
pointer[i] = val;
#pragma 行のコメントを外すとパフォーマンスが低下するのはなぜですか? openmp を使用してこの for ループを並列化すると、プログラムの実行時間がわずかに増加します。各アクセスは独立しているので、プログラムの速度が大幅に向上するはずではありませんか?
この for ループが tot の大きな値に対して実行されない場合、オーバーヘッドによって速度が低下する可能性はありますか?