次のコードを検討してください。
constexpr size_t size = 32;
constexpr size_t count = 8;
using WordCode = unsigned;
template<typename T>
int CmpHashArray(const T *l,const T *r)
{
auto * l1 = reinterpret_cast<const __int32*>(l);
auto * r1 = reinterpret_cast<const __int32*>(r);
if(*l1 == *r1)
return 0;
if(*l1 < *r1)
return -1;
return 1;
}
int CmpHashArray2(const WordCode *l,const WordCode *r)
{
return memcmp(l, r, size);
}
int main(...)
{
WordCode a1[count], a2[count];
CmpHashArray(a1, a2);
CmpHashArray2(a1, a2);
}
CmpHashArray には未定義の動作がありますか? -O2 を使用すると、memcmp の代わりに 2 つの asm 命令が必要になるためです。
UPD:
ご回答ありがとうございます。私が今見ているように、CmpHashArray は 1 に要約できます。sizeof(array) <= 64bit
このコードで memcmp をより高速に実行できるか? (64 および 32 ビット システム、クロスプラットフォーム)
template<typename T,
size_t count,
typename std::enable_if<count*sizeof(T) % 64 == 0>::type
>
int CmpHashArray(const T *l,const T *r)
{
auto * l1 = reinterpret_cast<const __int64*>(l);
auto * r1 = reinterpret_cast<const __int64*>(r);
size_t iterCount = count*sizeof(T) / 64;
while(iterCount--) {
if(*l1 == *r1)
return 0;
if(*l1 < *r1)
return -1;
else
return 1;
++l1;
++r1;
}
}