SeanEronAndersonのBitTwiddlingHacksには、とりわけこのトリックがあります。
並列に設定されたカウントビット
unsigned int v; // count bits set in this (32-bit value)
unsigned int c; // store the total here
static const int S[] = {1, 2, 4, 8, 16}; // Magic Binary Numbers
static const int B[] = {0x55555555, 0x33333333, 0x0F0F0F0F, 0x00FF00FF, 0x0000FFFF};
c = v - ((v >> 1) & B[0]);
c = ((c >> S[1]) & B[1]) + (c & B[1]);
c = ((c >> S[2]) + c) & B[2];
c = ((c >> S[3]) + c) & B[3];
c = ((c >> S[4]) + c) & B[4];
バイナリとして表されるB配列は、次のとおりです。
B[0] = 0x55555555 = 01010101 01010101 01010101 01010101
B[1] = 0x33333333 = 00110011 00110011 00110011 00110011
B[2] = 0x0F0F0F0F = 00001111 00001111 00001111 00001111
B[3] = 0x00FF00FF = 00000000 11111111 00000000 11111111
B[4] = 0x0000FFFF = 00000000 00000000 11111111 11111111
2進マジックナンバーBとSのパターンを続行することで、より大きな整数サイズのメソッドを調整できます。kビットがある場合、配列SとBはceil(lg(k))要素の長さである必要があります。そして、SまたはBが長いのと同じ数のcの式を計算する必要があります。32ビットvの場合、16の操作が使用されます。32ビット整数vのビットをカウントするための最良の方法は次のとおりです。
v = v - ((v >> 1) & 0x55555555); // reuse input as temporary
v = (v & 0x33333333) + ((v >> 2) & 0x33333333); // temp
c = ((v + (v >> 4) & 0xF0F0F0F) * 0x1010101) >> 24; // count
最良のビットカウント方法は、ルックアップテーブル方法と同じ12の操作のみを実行しますが、テーブルのメモリと潜在的なキャッシュミスを回避します。これは、上記の純粋な並列方式と、64ビット命令を使用しないものの、乗算を使用する以前の方式(64ビット命令でビットをカウントするセクション)のハイブリッドです。バイトに設定されたビットのカウントは並行して行われ、バイトに設定されたビットの合計は、0x1010101を掛けて右に24ビットシフトすることによって計算されます。
128までのビット幅の整数(タイプTでパラメーター化)への最良のビットカウント方法の一般化は次のとおりです。
v = v - ((v >> 1) & (T)~(T)0/3); // temp
v = (v & (T)~(T)0/15*3) + ((v >> 2) & (T)~(T)0/15*3); // temp
v = (v + (v >> 4)) & (T)~(T)0/255*15; // temp
c = (T)(v * ((T)~(T)0/255)) >> (sizeof(T) - 1) * CHAR_BIT; // count