rhipe と RHadoop [rmr rhdfs rhbase など] シリーズのパッケージを試していました。
[rhipe と rmr] の両方のパッケージで、csv またはテキスト ファイルに保存されたデータを取り込み/読み取ることができます。どちらも新しいファイル形式の作成をサポートしていますが、rmr の方がより多くのサポートを提供しているか、少なくとも開始するためのリソースが多いことがわかりました。この要件は、HDFS に保存された生データに対していくつかのデータ処理を実行する予定があり、最終的に Hive Impala などの Hadoop の他のコンポーネントが認識できる形式で HDFS に保存したい場合に役立ちます。どちらのパッケージも書き込み可能です。パッケージのみが認識できるネイティブ形式で。パッケージ rmr は、他のいくつかの形式をサポートしています。
rmr に関連する参照については、https ://github.com/RevolutionAnalytics/rmr2/blob/master/docs/getting-data-in-and-out.md を参照してください。
しかし、rhipe の場合、そのようなドキュメントは取得できず、さまざまな方法を試してみましたが失敗しました。
私の質問は、HDFS に保存されたファイルを読み取り、rhwatch
rhipe で実行した後、どのようにテキストに書き戻すことができるかです [たとえば、他の認識可能な形式も機能します]。