1

NUTCH 1.2 を使用してサイトを正常にクロールしました。これを solr 3.6 と統合したいと考えています。問題は、コマンドを発行しているときに
$ bin/nutch solrindex //localhost:8080/solr/ crawl/crawldb crawl/linkdb crawl/segments/*エラーが発生することです

 SolrIndexer: starting at 2013-07-08 14:52:27
java.io.IOException: Job failed!

この問題を解決するのを手伝ってください

ここに私のナッツログがあります

java.lang.RuntimeException: Invalid version (expected 2, but 60) or the data in not in 'javabin' format
    at org.apache.solr.common.util.JavaBinCodec.unmarshal(JavaBinCodec.java:99)
    at org.apache.solr.client.solrj.impl.BinaryResponseParser.processResponse(BinaryResponseParser.java:41)
    at org.apache.solr.client.solrj.impl.CommonsHttpSolrServer.request(CommonsHttpSolrServer.java:469)
    at org.apache.solr.client.solrj.impl.CommonsHttpSolrServer.request(CommonsHttpSolrServer.java:249)
    at org.apache.solr.client.solrj.request.AbstractUpdateRequest.process(AbstractUpdateRequest.java:105)
    at org.apache.solr.client.solrj.SolrServer.add(SolrServer.java:69)
    at org.apache.solr.client.solrj.SolrServer.add(SolrServer.java:54)
    at org.apache.nutch.indexer.solr.SolrWriter.close(SolrWriter.java:75)
    at org.apache.nutch.indexer.IndexerOutputFormat$1.close(IndexerOutputFormat.java:48)
    at org.apache.hadoop.mapred.ReduceTask.runOldReducer(ReduceTask.java:474)
    at org.apache.hadoop.mapred.ReduceTask.run(ReduceTask.java:411)
    at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:216)
2013-07-08 15:17:39,539 ERROR solr.SolrIndexer - java.io.IOException: Job f
4

1 に答える 1

0

これは主に、Nutch で使用される Solrj バージョンの jar と、統合しようとしている Solr 3.6 との間の javabin の非互換性です。

Solrj jar を更新し、ジョブを再生成する必要があります。

フォーラムに記載されている手順に従います。

于 2013-07-08T10:14:32.763 に答える