0

次のフィールドを持つSolrインデックスについて考えてみます。

<fields>
    <field name="id" type="uuid" indexed="true" stored="true" default="0"/>
    <field name="user" stored="true" type="string" multiValued="false" indexed="true"/>
    <field name="text" stored="true" type="textmulti" multiValued="false" indexed="true"/>
    <field name="media" stored="true" type="string" multiValued="false" indexed="true"/>
</fields>

またはフィールドのコンテンツが何であれ、同一userのフィールドを持つ現在のドキュメントが存在する場合、新しくインデックス付けされたドキュメントは重複している(したがって拒否される)と見なします。一致するドキュメント、または重複と見なされるのに十分でないドキュメントは、との両方である必要があります。textidmediauser text user text

SolrwikiでSolrインデックスを更新するためのドキュメント重複検出XMLメッセージを読みましたが、これを構成する方法がまだわかりません。何か案は?私は素晴らしいsolr-php-clientを使用してPHP経由でSolrに接続しています。

ありがとう。

4

1 に答える 1

1

おそらくそうしない理由がありますが、ユーザーとテキストの連結をidとして使用できます。上書きしない場合は、Solrが行うように、重複検出を使用する必要はありません。

于 2012-09-03T18:35:31.657 に答える