1

ミンハッシング アルゴリズムの実装では、整数のランダム順列を多数作成する必要があります。これは、ランダム ハッシュ関数を使用して (できるだけ多く) シミュレートされます。現在、次の形式のハッシュ関数を使用しています。

h(x) = (a*x + b) % c

ここで、a と b はランダムに生成された数値で、c は b の最大値よりも大きい素数です。とにかく、コードの実行が遅すぎて、合理的な実行時間内にそのようなハッシュ関数を 15 個以上使用することは不可能です。Python で整数にランダム ハッシュ関数を使用する他の方法を推奨できる人はいますか? 他の投稿で、ビットごとのシャッフルXOR演算を使用するための提案に出くわしましたが、このようなものをどのように実装する必要があるかを完全には理解していませんでした (私は Python に比較的慣れていません)。

4

1 に答える 1