Solr で次のシナリオを処理するにはどうすればよいDataImportHandler
ですか? 1 日 1 回、すべてのドキュメントを完全にインポートします (完全なインデックス作成には約 1 時間かかります)。すべてのドキュメントは、A と B という 2 つのクラスに分類されます。クラス A に属するドキュメントは 3% のみであり、これらのドキュメントは頻繁に変更されます。変更された時刻を使用して、deltaQuery を介して 10 分ごとにクラス A のドキュメントのインデックスを再作成します。ここまでは大丈夫。
ここで、クラス A のすべてのドキュメントを 1 時間ごとに再インデックスする必要もあります (別のテーブルに view_count 列があり、view_count を更新してもドキュメントの変更時刻は変わらないため)。これを行う方法?
更新 (短期的な解決策): 今のところ、デルタで変更された時刻をまったく使用せず、10 分ごとにクラス A のすべてのドキュメントのインデックスを再作成することにしました。クラス A のドキュメントをインデックス化するのに 3 分しかかからないので、今のところ問題ありません。ただし、任意の解決策が役立ちます。