1

データの配置に関する速度についてコンピューターをテストしています。テストは単純で、一度に 2 バイト、一度に 4 バイト、および 8 バイトよりも多くのデータをフェッチする同じバッファーを処理します。残りの (存在する場合) 数バイトを 2 バイト アクセスで処理します。テストの詳細はこちらに記載されています。

私の問題は、ループで実行すると、経過時間に対してまったく同じprintf結果が得られることです-これは明らかに真実ではなく、ループの最初にブレークポイントを設定すると確認されます-新しい結果は正しいようです. したがって、これはコンパイラの最適化に関して何かをしなければならないと思います(ただし、g ++には-O0フラグを設定しています)が、正確にはわかりません。わかりません。

g++ 4.4.7 Ubuntu 12.10 NetBeans AMDx64

それで、なにかお手伝いできますか?

for (int i = 0; i < 10; i++) {
    int* itab=new int[1000*256]; //1MiB table  
    double elapsed=0;
    boost::timer* t=new boost::timer();
    Munge16(itab, 250);
    elapsed = t->elapsed();
    printf("Munge8 elapsed:%d\n", elapsed);
    t->restart();
    delete t;
    elapsed=0;
    delete itab;
}

結果:

Munge8 経過:1721468076

Munge8 経過:1721468076

Munge8 経過:1721468076

Munge8 経過:1721468076

Munge8 経過:1721468076

Munge8 経過:1721468076

Munge8 経過:1721468076

Munge8 経過:1721468076

Munge8 経過:1721468076

Munge8 経過:1721468076


ここにブレークポイントがあります:

    for (int i = 0; i < 10; i++) {
breakpoint >> int* itab=new int[1000*256]; //1MiB table 

Munge8 経過:1721528944

Munge8 経過:1721529048

Munge8 経過:1721529174

Munge8 経過:1721529281

Munge8 経過:1721529496

Munge8 経過:1721529554

Munge8 経過:1721529643

Munge8 経過:1721529756

Munge8 経過:1721529808

Munge8 経過:1721529896


解決策はありますが、boost::timer がこのような奇妙な結果をもたらす理由はまだわかりません。実用的な解決策は、 のgettimeofday関数を使用すること<time.h>です。

class Timer {
private:

    timeval startTime;

public:

    void start(){
        gettimeofday(&startTime, NULL);
    }

    double stop(){
        timeval endTime;
        long seconds, useconds;
        double duration;

        gettimeofday(&endTime, NULL);

        seconds  = endTime.tv_sec  - startTime.tv_sec;
        useconds = endTime.tv_usec - startTime.tv_usec;

        duration = seconds + useconds/1000000.0;

        return duration;
    }

    long stop_useconds(){
        timeval endTime;
        long useconds;

        gettimeofday(&endTime, NULL);
        useconds = endTime.tv_usec - startTime.tv_usec;

        return useconds;
    }

    static void printTime(double duration){
        printf("%5.6f seconds\n", duration);
    }
};

テスト:

//test

for (int i = 0; i < 10; i++) {
     void *vp = malloc(1024*sizeof(int));
     memset((int *)vp, 0, 1024);
    void* itab = malloc(sizeof(int)*1024*256); //1MiB table  
    if (itab) {
        memset ( (int*)itab, 0, 1024*256*sizeof (int) );
        float elapsed;

        boost::timer t;
        Timer timer = Timer();
        timer.start();

        Munge64(itab, 1024*256);

        double duration = timer.stop();
        long lt = timer.stop_useconds();
        timer.printTime(duration);
        cout << t.elapsed() << endl;
        elapsed = t.elapsed();
        cout << ios::fixed << setprecision(10) << elapsed << endl;
        cout << ios::fixed << setprecision(10) << t.elapsed() << endl;
        printf("Munge8 elapsed:%ld useconds\n", lt);

        elapsed = 0;
        free(vp);
        free(itab);
        //printf("Munge8 elapsed:%d\n", elapsed);
    }
}

結果:

0.000100 秒

0 << ??????????

40 << ????????????????

40 << ??????????????????????????????????????

Munge8 の経過時間:100 useconds

0.000100 秒

0

40

40

Munge8 の経過時間:100 useconds

0.000099 秒

0

40

40

Munge8 の経過時間:99 useconds

4

1 に答える 1

0

boost::timer を使用しないでください - http://www.boost.org/doc/libs/1_54_0/libs/timer/doc/original_timer.html#Class timer

POSIX では、時計の時間ではなく、CPU 時間を測定します。

システムウォールクロックのドリフトやシフトから自分自身を分離したい場合は、タイマーを実装するときに他のクロックとして、boost::chrono または std::chrono を使用することを検討してください。

于 2013-07-16T01:19:55.863 に答える