1

いくつかの順序付けられたリストから数字を取得しようとしています。たとえば、リストは「ABCD E」であり、他のリストは「CBEADHGFIJ K」です。

したがって、それぞれが文字列に関連付けられた一連の順序付けられたリストである信頼できるデータがいくつかあり、文字列が指定された同じリストを取得してリストが一致する (または私の信頼できるデータの同じ文字列のリストに可能な限り似ています。

私は統計学について強いバックグラウンドを持っていません。私が使用できる方法と、それらを実装する方法を理解するのに役立つリンクまたはリソースを参照していただければ幸いです。

4

1 に答える 1

1

解決策は、類似性の概念によって異なります。一般的な類似度の尺度の 1 つは、レーベンシュタイン距離(ある文字列から別の文字列を取得するために必要な文字の追加、削除、および変更の数) です。

于 2012-05-19T07:20:19.813 に答える