0

ここに私のコードがあります:

val df=hiveContext.write.format("orc").options("orc.compression","SNAPPY").save(
"xyz")

ただし、ファイルは ZLIB として保存されます。

4

1 に答える 1

0

追加の conf "spark.io.compression.codec=snappy" を spark-shell / spark-submit に追加してみてください:

spark-shell --conf spark.io.compression.codec=snappy #rest of your command..

また、ORC 形式に書き込む場合 (Spark >= 1.5 を使用していると仮定)、次を使用できます。

myDf.orc("/some/path")

「orc」メソッドは、「.format("orc").save("/some/path")」を実行するのとまったく同じです。

于 2015-11-02T19:47:59.460 に答える