Solr 5.4.1 と Nutch 1.11 を実行しています。また、Apache Nifi、特に GetSolr プロセッサも使用しています。
私の SolrRecord の tstamp は、インデックスの値がフェッチされた時刻であることを理解しています。
私が抱えている課題は、GetSolr プロセスが NiFi 無人で動作することです。フィルターする日付フィールドを提供する必要があります。tstamp を使用すると、初めてデータフローに入力されます。その後、tstamp フィルターは、レコードが Solr に取り込まれた時間ではなく、インデックス時間を参照しているため、将来の値を除外します。
私の質問は、クローラーによるフェッチではなく、Solr への挿入のタイムスタンプを含む bin\nutch インデックスの時点で SolrRecord にフィールドを含めるにはどうすればよいかということです。