Has anyone had any luck writing custom indexers for nutch to index the crawl results with elasticsearch? Or do you know of any that already exist?
3002 次
4 に答える
10
Solr API を模倣する ElasticSearch プラグインを作成しました。このプラグインと標準の Nutch Solr インデクサーを使用すると、クロールされたデータを ElasticSearch に簡単に送信できます。プラグインと Nutch での使用方法の例は、GitHub で見つけることができます。
于 2012-02-09T20:29:34.980 に答える
3
Nutchがプラグ可能なバックエンドを追加することを知っており、それを見てうれしく思います。ElasticsearchをNutch1.3と統合する必要がありました。コードはここに掲載されています。(src / java / org / apache / nutch / indexer / solr)コードをピギーバックしました。
于 2011-11-21T13:52:33.050 に答える
2
まだ実行していませんが、これは間違いなく実行可能ですが、SOLR コード (src/java/org/apache/nutch/indexer/solr) をピギーバックして ElasticSearch に適合させる必要があります。ところでNutchへの素晴らしい貢献になるでしょう
于 2011-05-25T15:22:07.037 に答える
0
時が経ち、Nucth はすでに ElasticSearch とうまく統合されています。 ここに素晴らしいチュートリアルがあります。
于 2016-01-15T09:03:15.317 に答える