データの配置に関する速度についてコンピューターをテストしています。テストは単純で、一度に 2 バイト、一度に 4 バイト、および 8 バイトよりも多くのデータをフェッチする同じバッファーを処理します。残りの (存在する場合) 数バイトを 2 バイト アクセスで処理します。テストの詳細はこちらに記載されています。
私の問題は、ループで実行すると、経過時間に対してまったく同じprintf結果が得られることです-これは明らかに真実ではなく、ループの最初にブレークポイントを設定すると確認されます-新しい結果は正しいようです. したがって、これはコンパイラの最適化に関して何かをしなければならないと思います(ただし、g ++には-O0フラグを設定しています)が、正確にはわかりません。わかりません。
g++ 4.4.7 Ubuntu 12.10 NetBeans AMDx64
それで、なにかお手伝いできますか?
for (int i = 0; i < 10; i++) {
int* itab=new int[1000*256]; //1MiB table
double elapsed=0;
boost::timer* t=new boost::timer();
Munge16(itab, 250);
elapsed = t->elapsed();
printf("Munge8 elapsed:%d\n", elapsed);
t->restart();
delete t;
elapsed=0;
delete itab;
}
結果:
Munge8 経過:1721468076
Munge8 経過:1721468076
Munge8 経過:1721468076
Munge8 経過:1721468076
Munge8 経過:1721468076
Munge8 経過:1721468076
Munge8 経過:1721468076
Munge8 経過:1721468076
Munge8 経過:1721468076
Munge8 経過:1721468076
ここにブレークポイントがあります:
for (int i = 0; i < 10; i++) {
breakpoint >> int* itab=new int[1000*256]; //1MiB table
Munge8 経過:1721528944
Munge8 経過:1721529048
Munge8 経過:1721529174
Munge8 経過:1721529281
Munge8 経過:1721529496
Munge8 経過:1721529554
Munge8 経過:1721529643
Munge8 経過:1721529756
Munge8 経過:1721529808
Munge8 経過:1721529896
解決策はありますが、boost::timer がこのような奇妙な結果をもたらす理由はまだわかりません。実用的な解決策は、 のgettimeofday
関数を使用すること<time.h>
です。
class Timer {
private:
timeval startTime;
public:
void start(){
gettimeofday(&startTime, NULL);
}
double stop(){
timeval endTime;
long seconds, useconds;
double duration;
gettimeofday(&endTime, NULL);
seconds = endTime.tv_sec - startTime.tv_sec;
useconds = endTime.tv_usec - startTime.tv_usec;
duration = seconds + useconds/1000000.0;
return duration;
}
long stop_useconds(){
timeval endTime;
long useconds;
gettimeofday(&endTime, NULL);
useconds = endTime.tv_usec - startTime.tv_usec;
return useconds;
}
static void printTime(double duration){
printf("%5.6f seconds\n", duration);
}
};
テスト:
//test
for (int i = 0; i < 10; i++) {
void *vp = malloc(1024*sizeof(int));
memset((int *)vp, 0, 1024);
void* itab = malloc(sizeof(int)*1024*256); //1MiB table
if (itab) {
memset ( (int*)itab, 0, 1024*256*sizeof (int) );
float elapsed;
boost::timer t;
Timer timer = Timer();
timer.start();
Munge64(itab, 1024*256);
double duration = timer.stop();
long lt = timer.stop_useconds();
timer.printTime(duration);
cout << t.elapsed() << endl;
elapsed = t.elapsed();
cout << ios::fixed << setprecision(10) << elapsed << endl;
cout << ios::fixed << setprecision(10) << t.elapsed() << endl;
printf("Munge8 elapsed:%ld useconds\n", lt);
elapsed = 0;
free(vp);
free(itab);
//printf("Munge8 elapsed:%d\n", elapsed);
}
}
結果:
0.000100 秒
0 << ??????????
40 << ????????????????
40 << ??????????????????????????????????????
Munge8 の経過時間:100 useconds
0.000100 秒
0
40
40
Munge8 の経過時間:100 useconds
0.000099 秒
0
40
40
Munge8 の経過時間:99 useconds