1

すべての依存関係を含む1つのJARファイルを介してすべての機能にアクセスできる方法でNutchクローラーを実行しようとしています。

例えば、

java -jar nutch-all-1.2.jar -crawl <other params>

後の段階で、hadoopで呼び出します。

現在、

java -jar nutch-1.2.jar 

nutchディレクトリに存在するJARファイルで、エラーが発生します。

Failed to load Main-Class manifest attribute from
nutch-1.2.jar

これは、この特定のJARにマニフェストXMLファイルやその他の依存するJARが含まれていないために発生すると思います。この目的のために1つのJARにナッチを組み込むための最良の方法として何をお勧めしますか?

ありがとう!

4

1 に答える 1

1

よく調べてみると、コマンドラインからNutchを簡単に実行するために、代わりにnutch.jobファイルを使用できることに気付きました。構文は、

hadoop jar nutch-1.0.job org.apache.nutch.crawl.Crawl urls -dir crawl -depth 1
于 2011-03-02T22:11:54.333 に答える