0

文字列をマージするためのアルゴリズム (できれば Java 実装を使用) を探しています。

私の問題は次のとおりです。

文字列の配列/リスト{"myString1" , "my String1" , "my-String-1" ... } があるとします。これらすべての可能性が非常に高いことをアルゴリズムに指摘してもらいたい値は「myString1」を示します。

だから私は自分のリストをコンパクトにしたいと思います。これは KMP で実行できるか、もっと適切なものがあるかもしれません。

ありがとう。

4

2 に答える 2

1

編集距離は、文字列をマージするための優れたヒューリスティックだと思います。

編集:

距離の編集アルゴリズムを変更できます。

文字cのd(-、c)に異なる値を指定できます。

したがって、次の例: "String1"、 "String2"では、スコアを「罰する」ことができますが、d(1,2)を高くすると、「String 1」、「String1」は罰せられません。スコアはd(-、'')になります。

于 2012-08-06T21:00:11.247 に答える
0

または、おおよその文字列一致が役立つ可能性があります。KMP は部分文字列の正確なマッチング用に設計されているため、KMP が目的に適うとは思えません。

于 2012-08-06T21:03:43.253 に答える