次のフィールドを持つSolrインデックスについて考えてみます。
<fields>
<field name="id" type="uuid" indexed="true" stored="true" default="0"/>
<field name="user" stored="true" type="string" multiValued="false" indexed="true"/>
<field name="text" stored="true" type="textmulti" multiValued="false" indexed="true"/>
<field name="media" stored="true" type="string" multiValued="false" indexed="true"/>
</fields>
またはフィールドのコンテンツが何であれ、同一user
のフィールドを持つ現在のドキュメントが存在する場合、新しくインデックス付けされたドキュメントは重複している(したがって拒否される)と見なします。一致するドキュメント、または重複と見なされるのに十分でないドキュメントは、との両方である必要があります。text
id
media
user
text
user
text
SolrwikiでSolrインデックスを更新するためのドキュメント重複検出とXMLメッセージを読みましたが、これを構成する方法がまだわかりません。何か案は?私は素晴らしいsolr-php-clientを使用してPHP経由でSolrに接続しています。
ありがとう。