問題タブ [s3distcp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hadoop - java.lang.IllegalArgumentException: ソース ファイル リストとソース パスの両方が存在する
distcp
次のコマンドを実行して、HDFS から S3 にファイルをコピーしようとしています。
しかし、次のエラーが発生します。
hadoop - HDFS から S3 へのコピー中に GroupBy を使用してフォルダー内のファイルをマージする
HDFS に次のフォルダーがあります。
各フォルダーには 50 近くのファイルが含まれています。私の意図は、HDFS から S3 にコピーするときに、フォルダー内のすべてのファイルをマージして単一のファイルを取得することです。私が抱えている問題は、groupByオプションを使用した正規表現にあります。これを試しましたが、うまくいかないようです:
コマンド自体は機能しますが、各フォルダー内のファイルが単一のファイルにマージされないため、問題は正規表現にあると思われます。