Hadoop からダウンロードされるデータに対して R コードを実行するケースがあります。次に、R コードの出力も Hadoop にアップロードされます。現在、手動で行っていますが、この手動のダウンロード/アップロード プロセスを避けたいと考えています。
hdfsに接続してRでこれを行う方法はありますか? つまり、R スクリプトの最初に Hadoop に接続してデータを読み取り、最後に出力データを再度 Hadoop にアップロードします。使えるパッケージはありますか?Hadoop サーバーまたは R で必要な変更はありますか?
重要な部分に注意するのを忘れていました: R と Hadoop は異なるサーバー上にあります。