1

私はsolr-4.4.0とnutch-1.7を使用しています。私はsolrとnutchの初心者です。次のブログを使用してsolrとnutchを統合しようとしています::

http://www.building-blocks.com/thinking/building-a-search-engine-with-nutch-and-solr-in-10-minutes/

solr が正常に開始されました::

manish@ubuntu:~$ cd /usr/local/solr/example/
manish@ubuntu:/usr/local/solr/example$ java -jar start.jar

正常にインデックス化された URL と同様に::

manish@ubuntu:/usr/local/nutch/bin/nutch crawl urls -dir crawl -depth 3 -topN 50

出力例::

fetching http://www.tatvic.com/tatvic-excel-plugin-webinar (queue crawl delay=5000ms)
-activeThreads=10, spinWaiting=9, fetchQueues.totalSize=36
-activeThreads=10, spinWaiting=10, fetchQueues.totalSize=36
-activeThreads=10, spinWaiting=10, fetchQueues.totalSize=36
-activeThreads=10, spinWaiting=10, fetchQueues.totalSize=36
-activeThreads=10, spinWaiting=10, fetchQueues.totalSize=36
-activeThreads=10, spinWaiting=10, fetchQueues.totalSize=36
.
.
.
.
.
..

Parsed (1ms):http://www.tatvic.com/anomaly-detection/
Parsed (1ms):http://www.tatvic.com/blog/dynamic-funnel-in-google-analytics/
Parsed (1ms):http://www.tatvic.com/blog/google-analytics-custom-reports/
Parsed (0ms):http://www.tatvic.com/collaborative-filtering/
Parsed (1ms):http://www.tatvic.com/contact-thanks/
..
.
.
.
.
LinkDb: linkdb: crawl/linkdb
LinkDb: URL normalize: true
LinkDb: URL filter: true
LinkDb: internal links will be ignored.
LinkDb: adding segment: file:/usr/local/nutch/crawl/segments/20130909064920
LinkDb: adding segment: file:/usr/local/nutch/crawl/segments/20130909065449
LinkDb: adding segment: file:/usr/local/nutch/crawl/segments/20130909064936
LinkDb: adding segment: file:/usr/local/nutch/crawl/segments/20130909043135
LinkDb: adding segment: file:/usr/local/nutch/crawl/segments/20130909035154
LinkDb: merging with existing linkdb: crawl/linkdb
LinkDb: finished at 2013-09-09 07:01:53, elapsed: 00:00:04
crawl finished: crawl

しかし、solrに投稿しているときに、次のようになりました::

manish@ubuntu:/usr/local/nutch$ bin/nutch solrindex http://127.0.0.1:8983/solr/ crawl/crawldb -linkdb crawl/linkdb crawl/segments/*
Indexer: starting at 2013-09-09 07:05:05
Indexer: deleting gone documents: false
Indexer: URL filtering: false
Indexer: URL normalizing: false
No IndexWriters activated - check your configuration

Indexer: finished at 2013-09-09 07:05:12, elapsed: 00:00:07

本当の意味は?

ブラウザでは何も表示されません::

 http://127.0.0.1:8983/solr/select?q=tatvic

ブラウザのサンプル::

 <response><lst name="responseHeader"><int name="status">0</int><int name="QTime">111</int><lst name="params"><str name="q">tatvic</str></lst></lst><result name="response" numFound="0" start="0"/></response>

何度も挑戦しました!!

問題になる可能性があると思います。

これを理解するのを手伝ってもらえますか??

4

2 に答える 2

0

同じ問題があり、プラグインのプロパティを追加したところ、問題が解決しました。同様の質問に答えた以下のリンクを確認してください。

https://stackoverflow.com/a/25945844/3496666

于 2014-09-20T06:18:14.713 に答える
-2
$ bin/nutch solrindex http://localhost:8983/solr/ crawl/crawldb crawl/linkdb crawl/segments/*

SolrIndexer: 2013-09-11 08:23:14 に開始 SolrIndexer: 2013-09-11 08:23:28 に終了、経過: 00:00:13

私がこれを試したとき、それは完全に機能しました...

于 2013-09-11T04:01:57.480 に答える