indexing - Solr ファセットカウントが正しくない、重複排除する方法

Question

ファイルのインデックス作成に 2 つの solr を使用しています。更新を行うため、1 つの記事が両方の solr にインデックスされることがあります。これらの記事が重複しているため、ファセット数が正しくないという問題が発生します。カウントの重複を排除するにはどうすればよいですか?

score 0 · Accepted Answer

私のアドバイスは、重複した記事を保持しないことです。したがって、この重複する記事を識別し、1つのSOLRから削除する方法が必要です。

重複する記事を削除したくない場合でも、それらを追跡する必要があります。SOLR1のどの記事がSOLR2で重複しているかを知ることは、次のようにカウントを重複排除するのに役立ちます。

SOLR1に次の名前の追加フィールドを作成します。

IsDuplicateField = true, if article is duplicated in SOLR2
                 = false, otherwise

この状況では、ファセットIsDuplicateFieldは、複製されてクエリに一致するすべての記事を取得します。

幸運を！

indexing - Solr ファセット カウントが正しくない、重複排除する方法