0

lucene に基づく検索をサポートする APP があります。

または中国語と英語の両方の検索をサポートする他の方法はありますか?

4

1 に答える 1

0

こんにちは、私はあなたの質問を完全には理解していませんが、あなたが達成したいことについて大まかな考えがあると思います.

言語を個別に検索する場合は、インデックス時に Lucene フィールド「言語」を追加することをお勧めします。索引付けしているテキストの言語に応じて。

を使用すると、漢字と英語の文字を簡単に区別できるため、

Character.UnicodeBlock:

http://docs.oracle.com/javase/7/docs/api/java/lang/Character.UnicodeBlock.html

たとえば、文字列 "str" の char 1 をチェックしたい場合:

if(Character.UnicodeBlock.of(**str[1]**) == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS)
{ do something }

このようにして、検索時に中国語の入力を同じ方法で検出し、言語フィールドの条件をクエリに追加できます。

混合検索が必要な場合は、各単語を分析してその翻訳をインデックスに保存するカスタム アナライザーを構築することをお勧めします。

于 2013-09-26T15:18:40.983 に答える