フィールドを持ついくつかのログデータがあります
- ID、日付、情報
動的パーティション テーブルを作成しました
CREATE TABLE log_partitioned(id STRING, info STRING)
PARTITIONED BY ( tdate STRING)
そして、データをロードしています
FROM logs lg
INSERT OVERWRITE TABLE log_partitioned PARTITION(tdate)
SELECT lg.id, lg.info, lg.tdate
DISTRIBUTE BY tdate;
動的パーティショニングによってデータを正常にロードしています。しかし、データを見ようとすると
hdfs dfs -cat /user/hive/warehouse/log_partitioned/tdate=2000-11-05/part-r-00000
列の値は 2 つしかありません。
id1、info1
id2、info2 ....
ハイブクエリを実行すると
select * from log_partitioned limit 10
3 つの列すべてが表示されています。ハイブが基になるデータにパーティション列も格納するにはどうすればよいですか?