lucene で索引付けする多言語文書レコードがあります。つまり、各ドキュメント レコードは 1 つの言語ですが、異なる言語レコードが存在します。多言語クエリで検索できるように、それらを 1 つのインデックスに保持するつもりです。現在、ドキュメント レコードは次のような 1 つのデータ入力ファイルにあります。
<DOCID>1<\DOCID>
<LANGUAGE>CHINESE<\LANGUAGE>
<TEXT>中文内容<\TEXT>
<DOCID>2<\DOCID>
<LANGUAGE>ENGLISH<\LANGUAGE>
<TEXT>Some English text<\TEXT>
私の質問は: 1 つのインデックス ライターで同じフィールドに異なるアナライザーを使用する方法はありますか? または、ドキュメント レコードを異なる言語の 2 つの入力ドキュメントに分割して、異なるインデックス ライターを適用し、同じインデックスに追加する必要がありますか?
アドバイスありがとうございます!