0

今日、職場のサーバー (バージョン 0.57) に Presto をインストールしました。6 億 4000 万レコード (~64GB) しかないテーブルの場合、17 分以上かかります。

今、私はこれがプレストには遅すぎるという印象を受けていますが、よくわかりません.

いくつかの情報:

Hive と Presto はどちらも、ドキュメントのデフォルト構成でインストールされています。

Hive テーブルは、約 24 列の外部テーブルで、そのほとんどが文字列で、そのうちの 3 つは配列で、ファイルは Textfile として保存されます (Hive は何らかの理由で私のファイルで RCFile について不平を言います)。

このテーブルは、主にグループ化とカウント操作に使用されます。

パフォーマンスを向上させるためのヒントや、テーブルの単純な数 (*) に対する目標クエリ時間はどうあるべきですか?

乾杯

4

1 に答える 1