29

Spark SQL を使用してファイルを書き込もうとしていparquetます。

デフォルトでは、Spark SQL は をサポートしていますが、や などgzipの他の圧縮形式もサポートしています。snappylzo

これらの圧縮形式の違いは何ですか?

4

5 に答える 5

23

データで試してみてください。

lzo と snappy は高速な圧縮プログラムと非常に高速な圧縮解除プログラムですが、gzip と比較すると、圧縮率は低くなりますが、gzip は圧縮率が高くなりますが、速度は少し遅くなります。

于 2016-03-04T07:44:40.993 に答える