1

Mahoutの例の1つによって生成されたシーケンスファイルをストリーミングして、その内容を確認しようとしています。

    hadoop jar hadoop-streaming-0.20.2-cdh3u0.jar \
    -input /tmp/mahout-work-me/20news-bydate/bayes-test-input-output/ \
    -output /tmp/me/mm \
    -mapper "cat" \
    -reducer "wc -l" \
    -inputformat SequenceFileAsTextInputFormat

ジョブは正常に開始され、最終的に次のように終了します。

11/11/30 21:08:39 INFO streaming.StreamJob:  map 0%  reduce 0%
11/11/30 21:09:17 INFO streaming.StreamJob:  map 100%  reduce 100%
java.lang.RuntimeException: java.io.IOException: WritableName can't load class: org.apache.mahout.common.StringTuple

ストリーミングjarファイルに問題があるのか​​、IIがこのクラスを持つMahout jarを明示的に指す必要があるのか​​(HADOOP_CLASSPATHをmahout-core-0.5-cdh3u2.jarの場所に設定しようとしましたが、機能しませんでした)、または多分何か他のもの?

どんな助けでも大歓迎です。ありがとう。

4

1 に答える 1

2

このオプションを追加します。

-libjars mahout-core-0.5-cdh3u2.jar
于 2011-12-01T15:13:26.527 に答える