このコマンドを使用した多くのドキュメントと例がありますbin/nutch solrindex
が、bin/nutch elasticindex
コマンドは網羅されていません。Nutch 2.2.1 のインスタンスを Elasticsearch 0.90.2 と組み合わせるのに苦労しています。このプラグインを使用して、Elasticsearch を Solr インスタンスに偽装しようとしましたがbin/crawl
、内部サーバー エラーでジョブがクラッシュします。私が探しているのは、bin/crawl
Elasticsearch を使用するように変更された例、またはbin/nutch elasticindex
コマンドの詳細な説明です (nutch wiki にはページがありません)。すべてのフレーズsolrindex
をelasticindex
自由に置き換えることはできますか?
2 に答える
0
bin/crawl
コマンドを削除するように変更しbin/nutch solrdedup
、すべての言及を に置き換えましsolrindex
たelasticindex
。
于 2013-07-08T10:11:25.657 に答える
0
Nutch 2.2.x を Elasticsearch で動作させることは不可能だと思います。しかし、1.8 と比較して 2.2.x の追加の利点はわかりません。唯一のことは、Nutch 2.2.x が Gora を使用して、クロールされたページを選択したデータベースに保存することです。Elasticsearch を使用して結果のインデックスを作成しているため、データベースは必要ないと思います。私は Elasticsearch 0.90.11 で Nutch 1.8 を作成しました。私の GitHub アカウントでバンドルを見つけることができます: https://github.com/andreivisan/NutchElasticsearch
于 2014-04-12T23:00:47.497 に答える