問題タブ [rhadoop]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - RStudio とリモート R マシンの接続
Windows マシンに RStudio をインストールし、Hadoop クラスターのノードの 1 つに R をインストールしました。RStudio をそのスレーブ マシンに接続し、R スクリプトを実行したいと考えています。Hadoop 統合に必要なすべての R パッケージをそのスレーブ マシンにインストールしました。Windows ベースの R を使用できません。
r - Rhadoop - rmr を使用したワードカウント
Rhadoop パッケージを使用して単純な rmr ジョブを実行しようとしていますが、機能していません。私の R スクリプトは次のとおりです。
上記のスクリプトを次のように実行しています
エラーを下回っています。
何が問題なのか教えてください。
r - Devtools を使用して Github から RHadoop パッケージ rhdfs をインストールする方法
Devtools を使用して Github から Rhadoop をインストールする方法
私は基本的にhttps://github.com/RevolutionAnalytics/rhdfsからrhdfsをインストールしたいと思っています
しかし、これは機能しません
私は次のことを試しました
と
r - Rhadoop の mapreduce ジョブで readLines を使用できますか?
HDFS からテキストまたは gz ファイルを読み取って、単純な mapreduce ジョブ (実際にはマップ ジョブのみ) を実行しようとしていますが、readLines 部分が機能していないように見えるエラーが発生しました。mapreduce で readLines 関数を使用できるかどうかの回答を求めています。ps。mapreduce ジョブの外部で readLines 関数を使用して HDFS ファイルを解析するだけであれば問題ありません。ありがとう。
r - RHadoop (rmr2) を使用して json スキーマで avro ファイルを保存するにはどうすればよいですか?
make.output.format を使用した avro 出力形式のサンプル実装では、「バイト」をスキーマとして使用します。代わりに、json スキーマを avro ファイルに指定します。これを行う方法が見つかりませんでした。これを定義する backend.parameters がいくつかあると思います。
r - Java mapreduce の setup() と cleanup() に似た、R-Hadoop mapreduce のメソッドはありますか?
Java mapreduce の setup() と cleanup() に似た、R-Hadoop mapreduce のメソッドはありますか? すべてのレデューサーを開始する前に、db 呼び出しなどのコードの一部を 1 回だけ実行する必要があります。Rを使用してmapreduceコードを書くときにそれを行うための規定はありますか?
r - R-Hadoop 統合 - R をリモート hdfs に接続する方法
Hadoop からダウンロードされるデータに対して R コードを実行するケースがあります。次に、R コードの出力も Hadoop にアップロードされます。現在、手動で行っていますが、この手動のダウンロード/アップロード プロセスを避けたいと考えています。
hdfsに接続してRでこれを行う方法はありますか? つまり、R スクリプトの最初に Hadoop に接続してデータを読み取り、最後に出力データを再度 Hadoop にアップロードします。使えるパッケージはありますか?Hadoop サーバーまたは R で必要な変更はありますか?
重要な部分に注意するのを忘れていました: R と Hadoop は異なるサーバー上にあります。