1

私はこのような2つの文字列を持っています:

String1: EnableAdvertResult 
String2:AdvertisementDel

次に、次のように分割しました。

 X[0]=Enable X[1]=Advert X[2]=Result

 Y[0]=Advertisement Y[1]=Del

次に、次のように、各ペア要素間の類似度を計算します。

sim(x[0],y[0])=a, 
sim(x[0],y[1])=b, 
sim(x[1],y[0])=c, 
sim(x[1],y[1])=d, 
sim(x[2],y[0])=e, 
sim(x[2],y[1])=f

上記のシムに基づいて string1 と string2 の類似性を計算する最良の方法は何ですか?

4

2 に答える 2

0

それはレーベンシュタイン距離と呼ばれます。C# コードはレーベンシュタイン距離 c# にあります。Javaコードも見つかると思います。

于 2013-03-07T15:47:55.307 に答える
0

Apache StringUtilsに実装されている文字列間のレーベンシュタイン距離が必要です。私は Apache バージョンのレーベンシュタインを使用しましたが、良い結果が得られました。文字列比較に関するこのStackoverflow の記事も参照してください。

于 2013-03-07T15:51:08.853 に答える