0

このコマンドを使用した多くのドキュメントと例がありますbin/nutch solrindexが、bin/nutch elasticindexコマンドは網羅されていません。Nutch 2.2.1 のインスタンスを Elasticsearch 0.90.2 と組み合わせるのに苦労しています。このプラグインを使用して、Elasticsearch を Solr インスタンスに偽装しようとしましたがbin/crawl、内部サーバー エラーでジョブがクラッシュします。私が探しているのは、bin/crawlElasticsearch を使用するように変更された例、またはbin/nutch elasticindexコマンドの詳細な説明です (nutch wiki にはページがありません)。すべてのフレーズsolrindexelasticindex自由に置き換えることはできますか?

4

2 に答える 2

0

bin/crawlコマンドを削除するように変更しbin/nutch solrdedup、すべての言及を に置き換えましsolrindexelasticindex

于 2013-07-08T10:11:25.657 に答える
0

Nutch 2.2.x を Elasticsearch で動作させることは不可能だと思います。しかし、1.8 と比較して 2.2.x の追加の利点はわかりません。唯一のことは、Nutch 2.2.x が Gora を使用して、クロールされたページを選択したデータベースに保存することです。Elasticsearch を使用して結果のインデックスを作成しているため、データベースは必要ないと思います。私は Elasticsearch 0.90.11 で Nutch 1.8 を作成しました。私の GitHub アカウントでバンドルを見つけることができます: https://github.com/andreivisan/NutchElasticsearch

于 2014-04-12T23:00:47.497 に答える