6

Presto でサポートされているファイル形式は何ですか? パフォーマンスを向上させるために推奨される特定のファイル形式はありますか? Presto 用に最適化された RCfile のような円柱状のファイル形式があるかどうか知りたいですか?

4

5 に答える 5

8

Parquet 、ORC、RCFile、Avro、SequenceFile、TextFile、およびその他の形式ですべてのTrino (以前の PrestoSQL)リリースをテストしますが、Presto は標準の Hadoop ファイル形式をサポートする必要があります。Facebook ではほとんどのデータが ORC 形式であるため、現在この形式は Presto で最高のパフォーマンスを発揮します。

于 2013-11-12T19:02:49.237 に答える
1

Presto の現在のバージョンでは、ORC ファイルを使用することをお勧めします。Dain は presto で新しい ORC リーダーを完成させました。非常に高速です。ブログはこちら https://code.facebook.com/posts/370832626374903/even-faster-data-at-the-speed-of-presto-orc/

于 2015-04-03T03:47:16.893 に答える
1

現在、Text、SequenceFile、RCFile、ORC、および Parquet ファイル形式が Presto でサポートされています。参考:https ://prestodb.io/overview.html

于 2018-11-13T17:31:43.787 に答える