v と w を 2 つのビット文字列とします。現在のアプリケーションでは、それらは 8 ビットで構成されています。次の式を計算する最速の方法を探しています。
x = (v[1] & w[0]) ^ (v[2] & w[1]) ^ (v[2] & w[0]) ^ (v[3] & w[2]) ^ (v[3]) & w[1]) ^ (v[3] & w[0]) ^ ...
主題に関するいくつかのアイデア: 私が気づいたことの 1 つは、この式は次のようにも書けるということです。させて
P(w[k]) = w[k] ^ w[k-1] ^ ... ^ w[0]
wの最下位k + 1
ビットのパリティを示します。それで
x = (v[1] & P(w[0])) ^ (v[2] & P(w[1])) ^ (v[3] & P(w[2])) ^ ... ^ (v[7] & P(w[6]))
ifPw
は、各ビットが下位ビットのパリティを表すビット文字列です。つまり、次のようPw[i] = P(w[i-1])
にx
記述できます。
x = P(v & Pw)
さて、http://graphics.stanford.edu/~seander/bithacks.htmlで、文字列のパリティを計算する簡単な方法を見つけましたが、これに基づいて高速なアルゴリズムを構築するには、高速なアルゴリズムも必要です。Pw
上記のビット文字列を計算する方法。
あるいは、私はこれを完全に間違った方法で行っているのかもしれません。この方法で行うには、非常に多くのパリティ計算があります。これが実際に進むべき道である場合、(プログラムが x86 で実行されると仮定して) アセンブリでパリティ フラグを使用して計算を高速化できるかどうか疑問に思っていました。
最後に、これは私が開発しているアプリケーションで大量に必要とされる計算になるため、速度が非常に重要です。レジスター内ですべての計算を実行できるかどうか、およびこれがメモリ内にルックアップ テーブルを作成するよりも高速になるかどうか疑問に思っていました。