大文字と小文字を区別せずに 2 つの文字が等しいかどうかを比較するために、ASCII 用に最適化され た非常に高速な関数を作成する方法を見つけようとしています。is_iequal
最終的な目標は、このファンクターをboost::algorithm::starts_with
などで使用することです。
これまでのところ、私の試みは以下を生み出しました:
#include <locale>
unsigned long fast_rand(void);
template<class Ch> struct is_iequal
{
std::ctype<Ch> const &ctype;
is_iequal(std::ctype<Ch> const &ctype) : ctype(ctype) { }
bool operator()(Ch const c1, Ch const c2) const
{
return c1 == c2 ||
('a' <= c1 && c1 <= 'z' && c1 - 'a' == c2 - 'A') ||
('A' <= c1 && c1 <= 'Z' && c1 - 'A' == c2 - 'a') ||
!(c1 <= '\x7F' && c2 <= '\x7F') &&
ctype.toupper(c1) == ctype.toupper(c2);
}
};
int main()
{
size_t const N = 1 << 26;
typedef wchar_t TCHAR;
std::locale loc;
std::ctype<TCHAR> const &ctype = std::use_facet<std::ctype<TCHAR> >(loc);
is_iequal<TCHAR> const is_iequal(ctype); // Functor
TCHAR *s1 = new TCHAR[N], *s2 = new TCHAR[N];
for (size_t i = 0; i < N; i++) { s1[i] = fast_rand() & 0x7F; }
for (size_t i = 0; i < N; i++) { s2[i] = fast_rand() & 0x7F; }
bool dummy = false;
clock_t start = clock();
for (size_t i = 0; i < N; i++) { dummy ^= is_iequal(s1[i], s2[i]); }
printf("%u ms\n", (clock() - start) * 1000 / CLOCKS_PER_SEC, dummy);
}
unsigned long fast_rand(void) // Fast RNG for testing (xorshf96)
{
static unsigned long x = 123456789, y = 362436069, z = 521288629;
x ^= x << 16;
x ^= x >> 5;
x ^= x << 1;
unsigned long t = x;
x = y;
y = z;
z = t ^ x ^ y;
return z;
}
私のコンピューターでは、584 ミリ秒 (VC++ 2011 x64) で実行されます。
ただし、私のアプリケーションにはまだ少し遅すぎます。実際のプログラムではまだボトルネックであり、UI のわずかな遅延が発生するため、可能であれば取り除きたいと考えています。
is_iequals
インターフェイスを変更せずに、さらに最適化するにはどうすればよいですか?
注:はい、このコードのさまざまな問題 (UTF-16 の処理、 への/からの暗黙的なキャストに関するペダンティックな C++ の問題など) は認識していchar
ますが、ここでの私の目標には関係がないため、完全に無視しています。とりあえずそれら。