大量の言語をサポートするために使用できるように、現在の Apache Solr (4.x) を拡張するソリューションを探しています。私はマルチコアアプローチを採用したいと考えており、英語のコアと日本語のコア (初心者向け) を持つように solr をセットアップしました。物事に挑戦するために、solrがインデックスに使用するデータを含むn個の.xmlファイルが与えられます。明確にするために:
n 個の言語があり、n 個の .xml ファイルがあります (言語ごとに 1 つの .xml)。各 .xml ファイルは、マークアップに関して同一であり、生のテキストのみが異なります。
私の問題は、english.xml ファイルを英語のコアに厳密に投稿し、japanese.xml ファイルを日本語のコアに厳密に投稿する方法がわからないことです。そのため、次のページにアクセスすると:
www.example.com/ us /index.html で、english.xml のインデックス付きの結果を見ています。
www.example.com/jp/index.htmlは、 japanese.xmlの索引付けされた結果を提供します。
異なる言語の .xml ファイルはタグごとに同じように構造化されているため、スキーマは 1 つだけで十分ですが、各スキーマ ファイルはそれぞれの言語に合わせて最適化されるため、すべて複製しました。
もし (TLDR) {
How would I independently post:
english.xml -> core-english
japanese.xml -> core-japanese
Or what would be a better approach that gives me
facet and search independent groups so that I can localize my pages?
}
明らかに、solr の n 個の異なるインスタンスを実行したくありません。