1

クライアントから提供されたインデックス ファイルがあり、重複したドキュメントを削除してそれらを再インデックスしたいと考えています。

Solr重複排除

このために、インデックスからデータを読み取り、XMLファイルまたはCSVファイルを生成してから、重複を排除してインデックスを作成する必要があります。

(間違っている場合は修正してください。これを行う他の方法が見つかりませんでした)

Luceneを使用してこれが可能であることは知っていますが、solrを使用してこれを行う方法を知りたいと思いました

4

1 に答える 1

1

Solrクエリでwtパラメータをxml に設定することで、エクスポート形式を変更できます。...&wt=xml

これにより、結果がxmlにエクスポートされます。したがって、*を検索すると、limitパラメータに応じて完全なコンテンツが表示されます。

http://wiki.apache.org/solr/CoreQueryParameters#wt

これはcsvでも機能します:http ://wiki.apache.org/solr/CSVResponseWriter

于 2013-01-04T13:18:38.670 に答える