Nutch 2.0 でいくつかの URL をクロールしようとしましたが、以下のように失敗しました:
org.apache.nutch.crawl.Crawler urls -dir crawls -depth 5 -topN 100 スレッド「メイン」での例外 java.io.IOException: org.apache.hadoop.mapreduce.lib.input のジョブで入力パスが指定されていません。 org.apache.gora.mapreduce.GoraMapReduceUtils.getSplits(GoraMapReduceUtils.java: 67) org.apache.gora.store.impl.FileBackedDataStoreBase.getPartitions(FileBackedDataStoreBase.java:148) で org.apache.gora.mapreduce.GoraInputFormat.getSplits(GoraInputFormat.java:93) で org.apache.hadoop.mapred org.apache.hadoop.mapred.JobClient.writeSplits(JobClient.java:979) の .JobClient.writeNewSplits(JobClient.java:962) org.apache.hadoop.mapred.JobClient.access$600(JobClient.java:174) org.apache.hadoop.mapred.JobClient$2.run(JobClient.java:897) で org.apache.hadoop.mapred.JobClient$2.run(JobClient.java:850) で java.security.AccessController.doPrivileged (ネイティブ メソッド) org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1121) で javax.security.auth.Subject.doAs(Subject.java:396) org.apache.hadoop.mapred.JobClient で.submitJobInternal(JobClient.java:850) org.apache.hadoop.mapreduce.Job.submit(Job.java:500) org.apache.hadoop.mapreduce.Job.waitForCompletion(Job.java:530) org. apache.nutch.util.NutchJob.waitForCompletion(NutchJob.java:43) org.apache.nutch.crawl.GeneratorJob.run(GeneratorJob.java:180) org.apache.nutch.crawl.Crawler.runTool(Crawler. java:68) org.apache.nutch.crawl.Crawler.run(Crawler.java:152) で org.apache.nutch で。org.apache.nutch.crawl.Crawler.main(Crawler.java:257) の org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65) でのcrawl.Crawler.run(Crawler.java:250)
誰でも私を助けることができますか?どうもありがとう!