20

テストコード:

#include <cmath>
#include <cstdio>

const int N = 4096;
const float PI = 3.1415926535897932384626;

float cosine[N][N];
float sine[N][N];

int main() {
    printf("a\n");
    for (int i = 0; i < N; i++) {
        for (int j = 0; j < N; j++) {
            cosine[i][j] = cos(i*j*2*PI/N);
            sine[i][j] = sin(-i*j*2*PI/N);
        }
    }
    printf("b\n");
}

時間は次のとおりです。

$ g++ main.cc -o main
$ time ./main
a
b

real    0m1.406s
user    0m1.370s
sys     0m0.030s

を追加した後using namespace std;、時間は次のとおりです。

$ g++ main.cc -o main
$ time ./main
a
b

real    0m8.743s
user    0m8.680s
sys     0m0.030s

コンパイラ:

$ g++ --version
g++ (Ubuntu/Linaro 4.5.2-8ubuntu4) 4.5.2

組み立て:

Dump of assembler code for function sin@plt:                                    
0x0000000000400500 <+0>:     jmpq   *0x200b12(%rip)        # 0x601018 <_GLOBAL_OFFSET_TABLE_+48>
0x0000000000400506 <+6>:     pushq  $0x3                                     
0x000000000040050b <+11>:    jmpq   0x4004c0                                 
End of assembler dump.

Dump of assembler code for function std::sin(float):                            
0x0000000000400702 <+0>:     push   %rbp                                     
0x0000000000400703 <+1>:     mov    %rsp,%rbp                                
0x0000000000400706 <+4>:     sub    $0x10,%rsp                               
0x000000000040070a <+8>:     movss  %xmm0,-0x4(%rbp)                         
0x000000000040070f <+13>:    movss  -0x4(%rbp),%xmm0                         
0x0000000000400714 <+18>:    callq  0x400500 <sinf@plt>                      
0x0000000000400719 <+23>:    leaveq                                          
0x000000000040071a <+24>:    retq                                            
End of assembler dump.

Dump of assembler code for function sinf@plt:                                   
0x0000000000400500 <+0>:     jmpq   *0x200b12(%rip)        # 0x601018 <_GLOBAL_OFFSET_TABLE_+48>
0x0000000000400506 <+6>:     pushq  $0x3                                     
0x000000000040050b <+11>:    jmpq   0x4004c0                                 
End of assembler dump.
4

4 に答える 4

20

別のオーバーロードを使用しています:

試す

        double angle = i*j*2*PI/N;
        cosine[i][j] = cos(angle);
        sine[i][j] = sin(angle);

それは、有無にかかわらず同じように実行する必要がありますusing namespace std;

于 2011-08-07T23:23:21.470 に答える
4

違いは、std :: sin()にはfloatとdoubleのオーバーロードがあるのに対し、sin()はdoubleしか取らないことだと思います。floatの場合はstd::sin()内で、doubleへの変換が行われ、次にdoubleの場合はstd :: sin()が呼び出され、結果がfloatに変換されて、処理が遅くなる場合があります。

于 2011-08-07T23:27:45.150 に答える
2

-O3で実行し、最適化を使用してclangを使用していくつかの測定を行いましたIntel Core i7。見つけた:

  • std::sinオンfloatはと同じコストがかかりますsinf
  • std::sinオンdoubleはと同じコストがかかりますsin
  • のsin関数は、のdouble場合より2.5倍遅くなりますfloat(ここでも、で実行されますIntel Core i7)。

これを再現するための完全なコードは次のとおりです。

#include <chrono>
#include <cmath>
#include <iostream>

template<typename Clock>
struct Timer
{
    using rep = typename Clock::rep;
    using time_point = typename Clock::time_point;
    using resolution = typename Clock::duration;

    Timer(rep& duration) :
    duration(&duration) {
        startTime = Clock::now();
    }
    ~Timer() {
        using namespace std::chrono;
        *duration = duration_cast<resolution>(Clock::now() - startTime).count();
    }
private:

    time_point startTime;
    rep* duration;
};

template<typename T, typename F>
void testSin(F sin_func) {
  using namespace std;
  using namespace std::chrono;
  high_resolution_clock::rep duration = 0;
  T sum {};
  {
    Timer<high_resolution_clock> t(duration);
    for(int i=0; i<100000000; ++i) {
      sum += sin_func(static_cast<T>(i));
    }
  }
  cout << duration << endl;
  cout << "  " << sum << endl;
}

int main() {
  testSin<float> ([] (float  v) { return std::sin(v); });
  testSin<float> ([] (float  v) { return sinf(v); });
  testSin<double>([] (double v) { return std::sin(v); });
  testSin<double>([] (double v) { return sin(v); });
  return 0;
}

特に時間との関係で、彼らのアーキテクチャの結果についてのコメントで、人々が報告できるかどうか興味がありfloatますdouble

于 2018-07-05T17:23:08.667 に答える
1

コンパイラのコマンドラインで-Sフラグを使用し、アセンブラの出力の違いを確認します。たぶんusing namespace std;、実行可能ファイルに未使用のものをたくさん与えます。

于 2011-08-07T23:44:33.020 に答える