1

rmr+rhdfs(Rhadoop) と Datastax cassandra(CFS) に関する説明が必要です。現在、rhdfs および rmr(to.dfs(),from.dfs()) のすべての関数が機能しています。

しかし、mapreduce() を実行しようとすると、以下のエラーが発生します。

ストリーミング コマンドが失敗しました!Hadoop ストリーミングがエラー コード 1 で失敗しました。

さらに、jobtracker.no stderr にログをまったく作成していません。原因を教えていただけると助かります。

4

1 に答える 1

1

rmr 3.1.0 は Apache Hadoop 2.2.0 と互換性があります

https://github.com/RevolutionAnalytics/rmr2/blob/master/docs/compatibility.md

DSE はカスタマイズされた Hadoop 1.0.4 を使用するため、テストで mapreduce() が失敗する理由がわかります。

回避策の 1 つは、独自の Hadoop クラスターをセットアップし、HDFS を CFS に置き換えることです。

于 2014-04-21T16:10:48.367 に答える