次の 2 つの文字列を考えてみましょう: applesauce と apple-sauce . これらは同じオブジェクトを参照しています。したがって、これら 2 つの名前を含むレコードは重複と見なされます。ただし、R では、これらは別のレベルと見なされます。編集距離を使用して、これら 2 つの名前が stringdist パッケージを使用している程度を定量化できますか?
次の 2 つの文字列を考えてみましょう: applesauce と apple-sauce . これらは同じオブジェクトを参照しています。したがって、これら 2 つの名前を含むレコードは重複と見なされます。ただし、R では、これらは別のレベルと見なされます。編集距離を使用して、これら 2 つの名前が stringdist パッケージを使用している程度を定量化できますか?