8

Has anyone had any luck writing custom indexers for nutch to index the crawl results with elasticsearch? Or do you know of any that already exist?

4

4 に答える 4

10

Solr API を模倣する ElasticSearch プラグインを作成しました。このプラグインと標準の Nutch Solr インデクサーを使用すると、クロールされたデータを ElasticSearch に簡単に送信できます。プラグインと Nutch での使用方法の例は、GitHub で見つけることができます。

https://github.com/mattweber/elasticsearch-mocksolrplugin

于 2012-02-09T20:29:34.980 に答える
3

Nutchがプラグ可能なバックエンドを追加することを知っており、それを見てうれしく思います。ElasticsearchをNutch1.3と統合する必要がありました。コードはここに掲載されています。(src / java / org / apache / nutch / indexer / solr)コードをピギーバックしました。

https://github.com/ctjmorgan/nutch-elasticsearch-indexer

于 2011-11-21T13:52:33.050 に答える
2

まだ実行していませんが、これは間違いなく実行可能ですが、SOLR コード (src/java/org/apache/nutch/indexer/solr) をピギーバックして ElasticSearch に適合させる必要があります。ところでNutchへの素晴らしい貢献になるでしょう

于 2011-05-25T15:22:07.037 に答える
0

時が経ち、Nucth はすでに ElasticSearch とうまく統合されています。 ここに素晴らしいチュートリアルがあります。

于 2016-01-15T09:03:15.317 に答える