私は比較的 Apache SOlr に慣れていませんが、最近 DIH、特に XPathEntityProcessor を使用しています。新しい XML ファイルを定期的にインデックス化する方法が必要ですが、delta-import コマンドは sqlEntityProcessor [1] でのみサポートされているようです。
XMLファイルのますます大規模なデータセットを扱っており、solrが新しいファイルを特定してインデックス付けできることを望んでいました...
頭に浮かんだ潜在的な解決策は、ドキュメントをそれぞれの永続的な場所に移動する前に、以前にインデックス化されていないドキュメントで構成されるステージング領域から完全にインポートすることです。
- XPathEntityProcessor を使用してデルタ インポートを模倣する回避策はありますか?
- XPathEntityProcessor を使用している人々は、新しいドキュメントをインデックス化するためにどのようなアプローチを使用していますか?
[1] http://wiki.apache.org/solr/DataImportHandler#Using_delta-import_command-1