各ビット文字列の長さが1280で、200万近くのビット文字列を持つnumpy配列でハミング距離を計算するときに、計算時間を短縮しようとしています。
私の現在の実装には約 4 秒近くかかりますが、これは私の場合にはかなり悪いことです。私の現在のアプローチ:
>>> A = np.array
>>> A = A.repeat(2000000,axis=0)
>>> B = A
>>> A.shape
(2000000,)
>>> B.shape
(2000000,)
>>> first=(np.fromstring(A, dtype=np.uint8)-48).reshape(-1,1280)
>>> second=(np.fromstring(B, dtype=np.uint8)-48).reshape(-1,1280)
>>> hamm_dist = (first!=second).sum(1)
>>> hamm_dist.shape
(2000000,)
計算時間を 1 秒未満またはそれ以上に短縮できる高速な方法はありますか?