2

一連の Web サイトをクロールし、ページから特定の情報を抽出し、その特定の情報の全文索引を作成する検索エンジンを実装したいと考えています。

Xapian は、検索エンジン ライブラリに適しているように思えます。

Xapian と統合するためのクローラー/パーサーのオプションは何ですか?

Solr は、オープンソースのクローラー/パーサーと統合するために、Xapian よりも優れた選択肢でしょうか?

4

2 に答える 2

2

亜麻はあなたが探しているもののいくつかを提供するかもしれません。

于 2009-04-20T21:33:02.403 に答える
2

ここで、Xapian と Solr を少し比較します。

しかし、クローラーを作成したい場合は、Nutchをご覧ください。プラグインで拡張できるので、探している情報を分析するプラグインを作成できます。

于 2008-12-19T01:29:19.083 に答える