これらの2つの文字列シーケンスがあるとしましょう
abc cba bc
bc abc cba
上記の 2 つのシーケンスが同じバケットにマップされるように、そのようなシーケンス (シーケンスも文字列) のマッピングを作成しようとしています。
私の最初の考えは、各文字列に個別に適用されるハッシュ関数の結果を追加することです。このように、それらの順序は重要ではありません。シーケンス文字列全体にハッシュ関数を適用すると、もちろんハッシュ結果は異なります。
ただし、私は文字列ハッシュ関数の世界に非常に慣れていないため、このアプローチが効率的かどうかはわかりません。
このウェブサイトhttp://www.partow.net/programming/hashfunctions/index.html
文字列ハッシュのさまざまな実装を見つけましたが、どれが私のニーズに「最適」かはわかりません。
シーケンス内の各文字列に関する技術的な詳細は、それぞれが 25 文字を超えないことです。また、各シーケンスには 3 つを超える文字列はありません。
質問
1.
文字列ハッシュ関数の結果をシーケンスの各文字列に追加するこのアプローチは機能しますか?
2.
はいの場合、どの文字列ハッシュ関数を使用すれば、衝突が少なく、時間効率が高くなりますか?
前もって感謝します