問題タブ [distcp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - java.io.IOException: DistCp ジョブの送信中にリクエスト本文をサーバーに書き込み中にエラーが発生しました
distcp ジョブを送信して、セキュリティで保護されていない Hadoop クラスターからセキュリティで保護された (kerberized) クラスターにファイルをコピーすると、次のエラーが発生しました。
メッセージが広すぎるのでError writing request body to server
、何を掘り下げるべきか手がかりが得られません。ここに何かヒントはありますか?
参考までに、保護されたクラスターで mapreduce pi の例をテストしたところ、正常に動作しました。
hadoop - java.lang.IllegalArgumentException: ソース ファイル リストとソース パスの両方が存在する
distcp
次のコマンドを実行して、HDFS から S3 にファイルをコピーしようとしています。
しかし、次のエラーが発生します。
hadoop - HDFS から S3 へのコピー中に GroupBy を使用してフォルダー内のファイルをマージする
HDFS に次のフォルダーがあります。
各フォルダーには 50 近くのファイルが含まれています。私の意図は、HDFS から S3 にコピーするときに、フォルダー内のすべてのファイルをマージして単一のファイルを取得することです。私が抱えている問題は、groupByオプションを使用した正規表現にあります。これを試しましたが、うまくいかないようです:
コマンド自体は機能しますが、各フォルダー内のファイルが単一のファイルにマージされないため、問題は正規表現にあると思われます。