3

テキスト形式の外部テーブルでハイブを使用しています。このテーブルは 1 時間ごとに入力しますが、テーブルを月ごとに分割します (データセットは比較的小さいです)。毎時間、いくつかのパーティションに新しいデータを挿入したいと考えています。

INSERT INTO 句により、古いデータを含む既存のパーティションに新しいファイルが作成されます。このようにして、月末には各パーティションに約 700 個の小さなファイルができます。

HIVE がパーティション内の古いファイルにデータを追加する方法はありますか (古いデータで UNION ALL を使用せずに)?

4

1 に答える 1

2

残念ながら、現時点ではこれは不可能です。最近、ファイル追加パッチが勢いを増していることを願って、最終的には既存のファイルに追加する新しい機能になるでしょう。

これは、Hive の主な欠点の 1 つだと思います。

于 2012-08-22T21:04:32.317 に答える