いくつかの文字列があり、それらの類似性を測定したいのですが、文字の類似性よりも構造上の類似性に基づいて、たとえば文字列の編集距離とは異なります。
例: 312164 と 48479 は、数字のみで長さが同じであるため、非常に高いスコアを取得する必要があります。Bla blubb と bla bloob blo の場合、文字のみが含まれており、間にギャップがあるため、同じである必要があります。apple と app3 f のようなカップルには、いくつかの文字を共有していても構造が異なる場合でも、適用するスコアを少なくする必要があります。
そのようなもの.誰か手がかりを持っていますか? 可能であればJavaで。
ありがとうございました!