0

次のコードを検討してください。

constexpr size_t size = 32;
constexpr size_t count = 8;
using WordCode = unsigned;

template<typename T>
int CmpHashArray(const T *l,const T *r)
{
    auto * l1 = reinterpret_cast<const __int32*>(l);
    auto * r1 = reinterpret_cast<const __int32*>(r);
    if(*l1 == *r1)
        return 0;
    if(*l1 < *r1)
        return -1;
    return 1;
}

int CmpHashArray2(const WordCode *l,const WordCode *r)
{
    return memcmp(l, r, size);
}
int main(...)
{
  WordCode a1[count], a2[count];
  CmpHashArray(a1, a2);
  CmpHashArray2(a1, a2); 
}

CmpHashArray には未定義の動作がありますか? -O2 を使用すると、memcmp の代わりに 2 つの asm 命令が必要になるためです。

UPD:

ご回答ありがとうございます。私が今見ているように、CmpHashArray は 1 に要約できます。sizeof(array) <= 64bit

このコードで memcmp をより高速に実行できるか? (64 および 32 ビット システム、クロスプラットフォーム)

    template<typename T, 
             size_t count, 
             typename std::enable_if<count*sizeof(T) % 64 == 0>::type
            >
int CmpHashArray(const T *l,const T *r)
{
    auto * l1 = reinterpret_cast<const __int64*>(l);
    auto * r1 = reinterpret_cast<const __int64*>(r);
    size_t iterCount = count*sizeof(T) / 64;
    while(iterCount--) {
        if(*l1 == *r1)
            return 0;
        if(*l1 < *r1)
            return -1;
        else
            return 1;
        ++l1;
        ++r1;
    }
}
4

0 に答える 0