したがって、タブ区切りデータの外部テーブルがあります。単純なテーブルは次のようになります。
create external table if not exists categories
(id string, tag string, legid string, image string, parent string, created_date string, time_stamp int)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'
LOCATION 's3n://somewhere/';
ここで、最後に別のフィールドを追加します。これは、コンマで区切られた値のリストになります。
フィールドターミネータを指定するのと同じ方法でこれを指定する方法はありますか、それともセルデスの1つに依存する必要がありますか?
例えば:
...list_of_names ARRAY<String>)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' ARRAY ELEMENTS SEPARATED BY ','
...
(これにはSerdeを使用する必要があると思いますが、質問しても害はないと思いました)