0

私の問題は、Android アプリに約 1000 件以上のレコードがあることです

string field1;
string field2;
string field3;
string field4;
//...

field1この一連のレコードを検索し、2 つのフィールド (と)で最良の結果を得たいと考えていますfield2

現在、各レコードを読み取りcompare()、検索したいテキストと (文字列比較) するため、時間がかかります。

検索を実行する最良の方法は何ですか?

  1. 各レコードをSQLite DBに保存し、「select query where like」を実行します
  2. ハッシュマップ
  3. ? 他の提案はありますか?

または、レコードのインデックスを作成して検索することもできます。

4

1 に答える 1

0

完全に一致しないものを検索したい場合ArrayListMyAppRecord

public class MyAppRecord {
    private String record;
    private int deviance;
}

そして、レコードごとに、検索したい文字列の逸脱度を取得します。

public static int getLevenshteinDistance (String s, String t) {
    if (s == null || t == null) {
      throw new IllegalArgumentException("Strings must not be null");
    }    
    int n = s.length(); // length of s
    int m = t.length(); // length of t

    if (n == 0) {
      return m;
    } else if (m == 0) {
      return n;
    }

    int p[] = new int[n+1]; //'previous' cost array, horizontally
    int d[] = new int[n+1]; // cost array, horizontally
    int _d[]; //placeholder to assist in swapping p and d

    // indexes into strings s and t
    int i; // iterates through s
    int j; // iterates through t

    char t_j; // jth character of t

    int cost; // cost

    for (i = 0; i<=n; i++) {
       p[i] = i;
    }

    for (j = 1; j<=m; j++) {
       t_j = t.charAt(j-1);
       d[0] = j;

       for (i=1; i<=n; i++) {
          cost = s.charAt(i-1)==t_j ? 0 : 1;
          // minimum of cell to the left+1, to the top+1, diagonally left and up +cost                         
          d[i] = Math.min(Math.min(d[i-1]+1, p[i]+1),  p[i-1]+cost);  
       }

       // copy current distance counts to 'previous row' distance counts
       _d = p;
       p = d;
       d = _d;
    }

    // our last action in the above loop was to switch d and p, so p now
    // actually has the most recent cost counts
    return p[n];
  }
}

それを-objectに保存し、最後にMyAppRecord-objectsでソートArrayListします。devianceMyAppRecord

レコードのセットによっては、これには時間がかかる場合があることに注意してください。また、dogを検索しても、dogAまたはdogBがリスト内の特定の位置にあるかどうかを判断する方法はないことに注意してください。

Levenstheinの距離を読んで、それがどのように機能するかを理解してください。あなたは、あなたが持っているかもしれない閾値のために大丈夫な距離を得るために、おそらく長い/短い文字列を分類するという考えを得るかもしれません。

「十分に良い」結果を別のにコピーすることも可能ArrayListです。

于 2013-01-23T12:31:56.800 に答える