oneとtwoの 2つのテキスト ファイルがある場合、次の違いは何ですか。
bz2 one two -c >out.bz2
...と...
猫 1 2 | 猫 1 2 | bzip2 -c >out.bz2
?
具体的には、pbzip2を使用して bz2 ファイルを生成し、それらを HDFS に配置してから、豚から読み取り、MAPREDUCE-477をヒットしています。Hadoop クラスターをバージョン 0.20 からアップグレードできません。非並列の bz2 実装を使用すると遅すぎるため、非ブロック圧縮アルゴリズムを使用したいと考えています。
連結された bz2 ファイルを連結されていないファイルに変換する方法はありますか? または、連結されていない bz2 ファイルを生成するように pbzip2 を変更するにはどうすればよいでしょうか?
ありがとう -