概要:hadoopストリーミングで書き込まれた後に各出力ファイルで実行されるアクションを指定できますか?
基本的に、これは、hadoopmapreduce質問の出力をzipする最も簡単で効率的な方法のフォローアップです。キーごとにX
、その値をファイルに書き込み、アーカイブX.txt
に圧縮したいと思います。X.zip
しかし、zip出力ストリームを作成する場合、結果のファイルのキーや名前について何かを伝えるのは難しいため、X.zip
アーカイブに。が含まれることになりますdefault-name.txt
。
アーカイブの内容の名前を変更するのは非常に簡単な操作ですが、どこに配置できますか?私がやりたくないのは、S3からすべてのzipをダウンロードして、その時点でアップロードすることです。