cloudera - 寄木細工ベースの impala を kudu ベースの impala に移行するための Cloudera のベストプラクティスは何ですか

質問する 2018-12-19T15:13:02.810

339 次

Hadoop 環境として Cloudera を使用しています。

既存の寄木細工/インパラをクドゥ/インパラに統合または移行して、既存のパイプラインのパフォーマンスを向上させる方法について、誰かがガイダンスを提供してもらえますか?

既存のパイプラインの概要は次のとおりです。

データは csv/xlsx 形式で受け取ります。

既存のパイプラインは期待どおりに機能していますが、データが継続的に増加しているため、パイプラインに必要な時間/リソースも増加しています。

全体的なパフォーマンスを向上させるために、parquet ベースの impala を kudu ベースの impala に移行するベストプラクティスは何ですか?

どうもありがとうございました。

cloudera - 寄木細工ベースの impala を kudu ベースの impala に移行するための Cloudera のベスト プラクティスは何ですか