問題タブ [rhadoop]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2233 参照

r - RStudio とリモート R マシンの接続

Windows マシンに RStudio をインストールし、Hadoop クラスターのノードの 1 つに R をインストールしました。RStudio をそのスレーブ マシンに接続し、R スクリプトを実行したいと考えています。Hadoop 統合に必要なすべての R パッケージをそのスレーブ マシンにインストールしました。Windows ベースの R を使用できません。

0 投票する
1 に答える
3639 参照

r - Rhadoop - rmr を使用したワードカウント

Rhadoop パッケージを使用して単純な rmr ジョブを実行しようとしていますが、機能していません。私の R スクリプトは次のとおりです。

上記のスクリプトを次のように実行しています

エラーを下回っています。

何が問題なのか教えてください。

0 投票する
2 に答える
929 参照

r - Devtools を使用して Github から RHadoop パッケージ rhdfs をインストールする方法

Devtools を使用して Github から Rhadoop をインストールする方法

私は基本的にhttps://github.com/RevolutionAnalytics/rhdfsからrhdfsをインストールしたいと思っています

しかし、これは機能しません

私は次のことを試しました

0 投票する
1 に答える
71 参照

r - Rhadoop の mapreduce ジョブで readLines を使用できますか?

HDFS からテキストまたは gz ファイルを読み取って、単純な mapreduce ジョブ (実際にはマップ ジョブのみ) を実行しようとしていますが、readLines 部分が機能していないように見えるエラーが発生しました。mapreduce で readLines 関数を使用できるかどうかの回答を求めています。ps。mapreduce ジョブの外部で readLines 関数を使用して HDFS ファイルを解析するだけであれば問題ありません。ありがとう。

0 投票する
2 に答える
723 参照

r - sparkR を 64 ビット モードで実行する方法

Spark - 1.4.1 (R 3.1.3 バージョン) をインストールしました。現在、SparkR をテストして統計モデルを実行しています。次のようなサンプルコードを実行できます。

次に、rJavaパッケージを にインストールしますSparkR。しかし、それはインストールされていません。以下のエラーを与えます。

また、SparkRシェルでコマンドを実行しているときは、32 ビット アプリケーションとして起動されます。以下のようにバージョン情報を強調表示しました。 ここに画像の説明を入力

ですから、この問題を解決するのを手伝ってください。

0 投票する
0 に答える
371 参照

r - RHadoop (rmr2) を使用して json スキーマで avro ファイルを保存するにはどうすればよいですか?

make.output.format を使用した avro 出力形式のサンプル実装では、「バイト」をスキーマとして使用します。代わりに、json スキーマを avro ファイルに指定します。これを行う方法が見つかりませんでした。これを定義する backend.parameters がいくつかあると思います。

0 投票する
1 に答える
62 参照

r - Java mapreduce の setup() と cleanup() に似た、R-Hadoop mapreduce のメソッドはありますか?

Java mapreduce の setup() と cleanup() に似た、R-Hadoop mapreduce のメソッドはありますか? すべてのレデューサーを開始する前に、db 呼び出しなどのコードの一部を 1 回だけ実行する必要があります。Rを使用してmapreduceコードを書くときにそれを行うための規定はありますか?

0 投票する
2 に答える
4275 参照

r - R-Hadoop 統合 - R をリモート hdfs に接続する方法

Hadoop からダウンロードされるデータに対して R コードを実行するケースがあります。次に、R コードの出力も Hadoop にアップロードされます。現在、手動で行っていますが、この手動のダウンロード/アップロード プロセスを避けたいと考えています。

hdfsに接続してRでこれを行う方法はありますか? つまり、R スクリプトの最初に Hadoop に接続してデータを読み取り、最後に出力データを再度 Hadoop にアップロードします。使えるパッケージはありますか?Hadoop サーバーまたは R で必要な変更はありますか?

重要な部分に注意するのを忘れていました: R と Hadoop は異なるサーバー上にあります。