私はnutch2チュートリアルに従い、nutchをHBaseと正常に統合しました。私の問題は、ディレクトリで次のコマンドを使用してURLをクロールするとき
./nutch crawl urls/seed.txt abc -depth 50 -topN 50
ですruntime/local/bin
。
エラーが発生 :
Exception in thread "main" java.lang.RuntimeException: job failed: name=generate: null, jobid=job_local1552667151_0002
at org.apache.nutch.util.NutchJob.waitForCompletion(NutchJob.java:54)
at org.apache.nutch.crawl.GeneratorJob.run(GeneratorJob.java:199)
at org.apache.nutch.crawl.Crawler.runTool(Crawler.java:68)
at org.apache.nutch.crawl.Crawler.run(Crawler.java:152)
at org.apache.nutch.crawl.Crawler.run(Crawler.java:250)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
at org.apache.nutch.crawl.Crawler.main(Crawler.java:257)
解決策を教えてください。どんな解決策でも大歓迎です。