Lucene.netを使用して、Webサイトのコンテンツやドキュメントなどのインデックスを作成しています。インデックスは非常に単純で、次の形式になっています。
LuceneId-Luceneの一意のID(TypeId + ItemId) TypeId-テキストのタイプ(例:ページコンテンツ、製品、公開ドキュメントなど) ItemId-WebページID、ドキュメントIDなど。 テキスト-索引付けされたテキスト タイトル-検索結果とともに表示するWebページのタイトル、ドキュメント名など
多言語コンテンツを提供するように適応させるために、次のオプションがあります。
- 言語ごとに個別のインデックスを作成します。例:Lucene-enGB、Lucene-frFRなど。
- 1つのインデックスを保持し、それに「言語」フィールドを追加して、結果をフィルタリングします。
どちらが最良のオプションですか?それとも別のオプションがありますか?以前は複数のインデックスを使用したことがないので、2番目のインデックスに傾いています。