完全に一致しないものを検索したい場合ArrayList
はMyAppRecord
、
public class MyAppRecord {
private String record;
private int deviance;
}
そして、レコードごとに、検索したい文字列の逸脱度を取得します。
public static int getLevenshteinDistance (String s, String t) {
if (s == null || t == null) {
throw new IllegalArgumentException("Strings must not be null");
}
int n = s.length(); // length of s
int m = t.length(); // length of t
if (n == 0) {
return m;
} else if (m == 0) {
return n;
}
int p[] = new int[n+1]; //'previous' cost array, horizontally
int d[] = new int[n+1]; // cost array, horizontally
int _d[]; //placeholder to assist in swapping p and d
// indexes into strings s and t
int i; // iterates through s
int j; // iterates through t
char t_j; // jth character of t
int cost; // cost
for (i = 0; i<=n; i++) {
p[i] = i;
}
for (j = 1; j<=m; j++) {
t_j = t.charAt(j-1);
d[0] = j;
for (i=1; i<=n; i++) {
cost = s.charAt(i-1)==t_j ? 0 : 1;
// minimum of cell to the left+1, to the top+1, diagonally left and up +cost
d[i] = Math.min(Math.min(d[i-1]+1, p[i]+1), p[i-1]+cost);
}
// copy current distance counts to 'previous row' distance counts
_d = p;
p = d;
d = _d;
}
// our last action in the above loop was to switch d and p, so p now
// actually has the most recent cost counts
return p[n];
}
}
それを-objectに保存し、最後にMyAppRecord
-objectsでソートArrayList
します。deviance
MyAppRecord
レコードのセットによっては、これには時間がかかる場合があることに注意してください。また、dogを検索しても、dogAまたはdogBがリスト内の特定の位置にあるかどうかを判断する方法はないことに注意してください。
Levenstheinの距離を読んで、それがどのように機能するかを理解してください。あなたは、あなたが持っているかもしれない閾値のために大丈夫な距離を得るために、おそらく長い/短い文字列を分類するという考えを得るかもしれません。
「十分に良い」結果を別のにコピーすることも可能ArrayList
です。