0

Word、PDFドキュメントなどのリッチドキュメントで検索を行うために、solr dataimporthandler tikaを使用しています。新しいファイルが追加されたり、ファイルが変更されたりするたびに、検索に変更を含めるためにフル インポートを実行する必要があります。ドキュメントの数が非常に多いため、新しく追加または変更されたドキュメントのみを再インデックス化するオプションが必要です (デルタ インポートと同様)。delta-import は tika-entity プロセッサでは使用できず、私のシナリオでは clean=false 属性も機能しないことを知っています。とにかくこれを達成する方法はありますか?事前にご回答いただきありがとうございます。

4

0 に答える 0