1 ~ 500 要素のコレクションがいくつかあります。コレクションの平均サイズは 17 です。すべての要素のハッシュを取得して、新しい要素がまだコレクションの一部になっていないことを確認し、可能な限り最小のハッシュ文字列を探しています。現在sha1
、コレクション内の各アイテムに固有の要素の 1 つを使用していますが、そのサイズを縮小したいと考えています。
格納する必要がある文字列を短くするには、どのような方法を使用できますか: 文字列の最初の X 要素を取得しますか? X最後?
sha1 文字列の小さなサブセットだけを取得しても安全ですか? もしそうなら、例えばX文字と500個の要素との衝突確率は? (X は 3,4,5 またはそれ以上ですか?)