あなたの投稿を利用しようとしています: https ://gist.github.com/2884606
次のコマンドを実行しようとしています。
hadoop jar mongo-hadoop-streaming-assembly * .jar -mapper mapper.rb -reducer reducer.rb -inputURI mongodb://127.0.0.1/twitter.in -outputURI mongodb://127.0.0.1/twitter.out
次のエラーが発生します:スレッド「main」の例外java.lang.ClassNotFoundException:com.mongodb.hadoop.streaming.MongoStreamJob
jar mongo-hadoop-streaming-assembly * .jarをコンパイルしましたが、上記のクラスが含まれていません。
-libjarを使用してクラスのアーカイブを含めようとしましたが、hadoopがそれを認識していません。
また、上記を含めるためにCLASS_PATHをエクスポートしようとしました。
以下を使用してHadoopストリーミングを構築し ますhttps://github.com/mongodb/mongo-hadoop/tree/master/streaming
./sbt mongo-hadoop-streaming / assembly