一致させてから、後で文字列を最も近い一致に置き換えたいです。stringdist ライブラリを使用しています。以下は私のコードです
stringdistmatrix("2 ltr thums up", c("solar thyme 30g", "Thums Up 2 L"), method = "lv")
次のような出力が得られます。
[,1] [,2]
8 12
「ソーラータイム30g」の方が「2リットルサムズアップ」に近いということですが、実際は「サムズアップ2L」の方が近いはずです。レーベンシュタイン法を別のものに変えましょうか?