0

単一の Solr コアで複数の異なるタイプのレコードにインデックスを付ける方法 (可能な場合) の全体像に苦労しています。複数のレコードは、異なる一意のキーを持つことを意味します

特定のレベルですべてを一度に検索できるようにし、コアをまとめて石畳にする必要がないため、単一のコアを使用する傾向があります。

たとえば、次のフィールドを持つ製品があります。

product_code <--- unique key
product_title 
product_description 
etc...

次に、フィールドを持つ求人情報があります。

job_id <---- unique key
job_description
job_title
etc... 

「id」の一意のIDを持つNutch検索インデックスを含む、他にも複数のエンティティがあります

schema.xml に複数の一意のキーを含めることは可能ですか? IDが異なる種類のレコードを異なるsolrコアに送信する必要がないようにするには?

私が持っている主な懸念は、<uniqueKey>s を識別する際に少なくとも 1 つが必要である必要があることですが、solr インデックスに送信されるすべてのレコードが必要なキーを持っているわけではありません。

Solr でこの問題を回避する方法はありますか?

4

1 に答える 1

1

https://wiki.apache.org/solr/MultipleIndexes#Flattening_Data_Into_a_Single_Indexおよび https://wiki.apache.org/solr/UniqueKeyを参照してください

Solr は uniqueKey を必要としません。一意のキーを指定しない場合は、次のことを行う必要があります。既存のドキュメントと同じキーを持つ新しいドキュメントを投稿すると、新しいドキュメントは古いドキュメントを置き換えないため、古いものを最初に手動で追加してから、新しいものを追加します(そしてもちろんコミットします)。

一意のキーが必要な場合は、タイプに基づく ID にプレフィックスを追加します。次に、id と type のような他の 2 つのフィールドを持つことができます。たとえば、次のようになります。

uniquekey: P1
product_code: 1
type: product

uniquekey: J1
job_id: 1
type: job
于 2013-06-27T20:56:21.493 に答える