0

Lucene を使用して、検索エンジン (RTL 言語) で単語をオートコンプリートし、3 文字の挿入後にオートコンプリート機能が呼び出されます。

ワイルドカード関数を呼び出す前に、3 文字のクエリに一致する近接が必要です。

たとえば、この比較に一致する近接性を使用して、すべてのエントリの最初の 3 文字に対してのみ、データベースに対して部分文字列検索を行いたいと思います。

おそらく私は掘り出し物を探していますが、結果に犬も入れたいので 、近接一致が 1 に等しい状態でdig (検索エンジンの最初の 3 文字) を入力した場合、掘り出し物が表示されます。 .

それをしてもいいですか?

4

2 に答える 2

0

IndexReader のTermsメソッドを使用して、インデックス内の用語を列挙できます。その後、カスタム関数を使用して、これらの用語と検索テキストの間の距離を計算できます。デモにはレーベンシュタイン距離を使用します。

var terms = indexReader.ClosestTerms(field, "dig")
                       .OrderBy(t => t.Item2)
                       .Take(10)
                       .ToArray();

public static class LuceneUtils
{
    public static IEnumerable<Tuple<string, int>> ClosestTerms(this IndexReader reader, string field, string text)
    {
        return reader.TermsStartingWith(field, text[0].ToString())
                     .Select(x => new Tuple<string, int>(x, LevenshteinDistance(x, text)));
    }

    public static IEnumerable<string> TermsStartingWith(this IndexReader reader, string field, string text)
    {
        using (var tEnum = reader.Terms(new Term(field, text)))
        {
            do
            {
                var term = tEnum.Term;
                if (term == null) yield break;
                if (term.Field != field) yield break;
                if (!term.Text.StartsWith(text)) yield break;
                yield return term.Text;
            } while (tEnum.Next());
        }
    }

    //http://www.dotnetperls.com/levenshtein
    public static int LevenshteinDistance(string s, string t)
    {
        int n = s.Length;
        int m = t.Length;
        int[,] d = new int[n + 1, m + 1];

        // Step 1
        if (n == 0) return m;

        if (m == 0) return n;


        // Step 2
        for (int i = 0; i <= n; d[i, 0] = i++) { }

        for (int j = 0; j <= m; d[0, j] = j++) { }

        // Step 3
        for (int i = 1; i <= n; i++)
        {
            //Step 4
            for (int j = 1; j <= m; j++)
            {
                // Step 5
                int cost = (t[j - 1] == s[i - 1]) ? 0 : 1;

                // Step 6
                d[i, j] = Math.Min(
                    Math.Min(d[i - 1, j] + 1, d[i, j - 1] + 1),
                    d[i - 1, j - 1] + cost);
            }
        }
        // Step 7
        return d[n, m];
    }
}
于 2013-07-29T15:04:34.733 に答える