mapreduce の出力を gzip に圧縮するには、
"mapred.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec"
Hadoop に zip コーデックを実装するのは簡単ですか? Zipはコンテナですが、アーカイブごとに1つのファイルしか必要ないのでZipCodec
、CompressionCodec
インターフェイスで簡単に作成できますか?
または、同じ圧縮アルゴリズムを使用できるため、gz
ファイルをsに変換する効率的な方法があるのでしょうか?zip