0

すでに Lucene3.5 を使用するプロジェクトがあります。

ここで、Web 検索機能を提供する必要がありますが、Nutch プロジェクト全体をインポートしたくありません。

ですから、Nutch のクローラー部分を使用して Web サイトをクロールし、それらを Lucene スタイルにインデックス付けすることしかできないのではないでしょうか。

次に、既存の Lucene サーチャーでインデックス ファイルを検索します。

これを行うことは可能ですか、それとも何か提案はありますか (Heritrix はどうですか)?

4

1 に答える 1

0

はい、独自の lucene 実装を使用して、nutch によって生成されたインデックスを検索することは可能です。私たちのプロジェクトの wiki に簡単な説明を書きました。ここでは、nutch を使用して静的コンテンツをクロールしています。

こちらでご覧いただけます: http://code.google.com/p/gtxcontentconnector/wiki/HowTo_Nutch

br、クリス

于 2012-04-06T07:55:02.270 に答える