正しい場所名のベクトルに対して曖昧さを解消しようとしている場所のベクトルがあります。この例では、明確な場所を 2 つだけ使用しています。
agrepl('Au', c("Austin, TX", "Houston, TX"),
max.distance = .000000001,
ignore.case = T, fixed = T)
[1] TRUE TRUE
ヘルプページにはmax.distance
、
試合で許容される最大距離。整数として、またはパターン長に最大変換コストを掛けた分数として表されます。
レーベンシュタイン距離の数学的な意味についてはよくわかりません。私の理解では、距離が小さいほど、明確化された文字列のベクトルとの不一致に対する許容度が厳しくなります。
それで、2つ取得するように調整しますFALSE
か?基本的には、TRUE
次のように1文字の違いがある場合にのみ使用したいと思います:
agrepl('Austn, TX', "Austin, TX",
max.distance = .000000001, ignore.case = T, fixed = T)
[1] TRUE