特に WDDM モードで GPU を実行している場合、Windows は GPU カーネル実行の詳細なタイミングに影響を与えます。X が GPU で実行されていない Linux 環境で、観測と FFT を再実行してください。これにより、最も一貫した動作が得られます。WDDM セットアップの CUDA ドライバーは、ある程度、Windows オペレーティング システムの影響を受けます。
SM35 デバイス、CentOS 5.5、CUDA 5.5 でコードを実行したところ、次の Times.dat 出力が得られました。
0.007648 0.0024 0.001888 0.001888 0.001888 0.001888 0.001888 0.00192 0.001888 0.001888 0.00192 0.00192 0.001856 0.00192 0.001888 0.00192 0.001888 0.001888 0.001888 0.001888 0.00192 0.001888 0.001888 0.001888 0.001856 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.002016 0.001888 0.001888 0.00192 0.001952 0.001888 0.001888 0.001888 0.001888 0.00192 0.00192 0.001888 0.00192 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.00192 0.001888 0.001888 0.001856 0.001888 0.00192 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.003904 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.00192 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.00192 0.001888 0.001888 0.001888 0.001888 0.00192 0.001888 0.00192 0.001888 0.001888 0.001888 0.001888 0.001888 0.00192 0.001888 0.00192 0.001856 0.001888 0.001856 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.001952 0.001888 0.001888 0.00192 0.00192 0.00192 0.001888 0.001888 0.001952 0.001888 0.00192 0.001888 0.001856 0.001888 0.00192 0.001888 0.001888 0.001888 0.00192 0.001856 0.001888 0.001888 0.001888 0.001888 0.00192 0.00192 0.001888 0.001888 0.00192 0.001888 0.001888 0.001888 0.001888 0.001888 0.00192 0.001888 0.00192 0.001888 0.001888 0.00192 0.001888 0.00192 0.001888 0.001888 0.001888 0.001888 0.001888 0.00192 0.004448 0.001888 0.001952 0.001888 0.001888 0.001888 0.001888 0.001888 0.001856 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.00192 0.001856 0.001888 0.001888 0.001888 0.001888 0.001856 0.001888 0.001888 0.001856 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888 0.001888
時折変動がありますが、変数がミリ秒単位cudaTime
で時間をキャプチャしていることを忘れないでください。したがって、上記のデータで見られる変動は、ほとんどの場合、実行ごとに 1 マイクロ秒未満の変動です。
最初の数値を除外すると、私が目にする最大の変動は、いくつかのケースでは約 2 ~ 3 マイクロ秒です。測定された実行時間が通常 2 マイクロ秒未満であることを考えると、これは大きな変動ですが、まだノイズの中にあり、報告している数十マイクロ秒のようなものではありません。
訓練を受けていない私の目には、データに正弦波パターンも見られませんが、そこに 11 Hz の周波数があると言われたら (これらのデータ ポイントにはタイムスタンプが付けられていないため、それが何を意味するのかさえわかりません)。 -- 私はあなたの言葉を信じます。