0

Impala ステートメント INSERT INTO PARTITION(...) SELECT * FROM は、すべてのパーティションに ~350 MB の多数の寄木細工のファイルを作成します。

「Parquet データ ファイルは 1 GB のブロック サイズを使用するため、データをどの程度細かく分割するかを決定するときは、多くのパーティションに分割された小さなファイルを多数作成するのではなく、各パーティションに 1 GB 以上のデータが含まれる粒度を見つけるようにしてください。」

Impala バージョン 1.1.1 を使用しています。

寄木細工のファイルサイズを増やす方法は?

4

0 に答える 0