バイトあたりの CPU サイクルを測定するコードをいくつか書きました。私は否定的にcpb
なっていますが、理由はわかりません...それは私にそれを示していますcpb = -0.855553 cycles/byte
私の疑似コード:
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
uint64_t rdtsc(){
unsigned int lo,hi;
__asm__ __volatile__ ("rdtsc" : "=a" (lo), "=d" (hi));
return ((uint64_t)hi << 32) | lo;
}
int main()
{
long double inputsSize = 1024;
long double counter = 1;
long double cpuCycleStart = rdtsc();
while(counter < 3s)
function(args);
long double cpuCycleEnd = rdtsc();
long double cpb = ((cpuCycleEnd - cpuCycleStart) / (counter * inputsSize));
printf("%Lf cycles/byte\n", cpb);
return 0;
}
編集、改善されたコード、結果は同じです(ネガティブ):
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
unsigned long rdtsc( void )
{
unsigned long lo, hi;
asm( "rdtsc" : "=a" (lo), "=d" (hi) );
return( lo );
}
int main()
{
long double counter;
long double inputsSize = 1024;
char *buff = createInput(inputsSize);
long double cpuCycleStart = rdtsc();
countDownTime(3.0);
for(counter=1; !secondsElapsed; counter++)
function(args);
long cpuCycleEnd = rdtsc();
long double cpb = ((cpuCycleEnd - cpuCycleStart) / (counter * inputsSize));
printf("%Lf cycles/byte\n", cpb);
return 0;
}
本当に奇妙です。テストコードを書きました:
printf("\n%lu cpuCycleEnd \n%lu cpuCycleStart \n", cpuCycleEnd, cpuCycleStart);
printf("\n%lu counter\n%lu inputsSize \n\n", counter, inputsSize);
long double cpb = (((long double)cpuCycleEnd - (long double)cpuCycleStart) / ((long double)counter * (long double)inputsSize));
printf("%Lf cycles/byte\n", cpb);
これは以下を示します:
30534991 cpuCycleEnd
1139165971 cpuCycleStart
1273029 counter
1024 inputsSize
-0.850450 cycles/byte
何か案は?