Apache Nutch クローラーを Solr Index サーバーと統合できますか?
編集:
私たちの開発者の 1 人が、これらの投稿から解決策を思いつきました
答え
はい
Apache Nutch クローラーを Solr Index サーバーと統合できますか?
編集:
私たちの開発者の 1 人が、これらの投稿から解決策を思いつきました
答え
はい
Nutch 1.0 にアップグレードする場合は、Lucid Imagination の記事http://www.lucidimagination.com/blog/2009/03/09/nutch-solr/で説明されているように、solrindex を使用できます。
Nutch 2.x は、デフォルトで solr を使用するように設計されています。http://wiki.apache.org/nutch/Nutch2Tutorialの手順に従うか、書籍「Web Crawling and Data Mining with Apache Nutch」のより適切な手順に従うことができます。
それはまだ未解決の問題です。冒険心があれば、自分でこれらのパッチを適用してみることができますが、それほど単純ではないように見えます