テキスト形式の外部テーブルでハイブを使用しています。このテーブルは 1 時間ごとに入力しますが、テーブルを月ごとに分割します (データセットは比較的小さいです)。毎時間、いくつかのパーティションに新しいデータを挿入したいと考えています。
INSERT INTO 句により、古いデータを含む既存のパーティションに新しいファイルが作成されます。このようにして、月末には各パーティションに約 700 個の小さなファイルができます。
HIVE がパーティション内の古いファイルにデータを追加する方法はありますか (古いデータで UNION ALL を使用せずに)?