Lucene にレガシー コードがあり、新しい要件として、クロールに Apache Nutch を使用する必要があります。これは、Apache Nutch がコンテンツをクロールし、既存の Lucene アナライザーがインデックスを生成する必要があることを意味します。
私の問題は、Apache Nutch が既にコンテンツを生成できないインデックスを生成していることです。Nutch インデックスは使用したくありません。
別のクローラーを使用することをお勧めしますか、それともこの目的のために Apache Nutch を使用することはまだ可能ですか?