タイムスタンプ列を含むログ ファイルがあります。タイムスタンプは UNIX エポック時間形式です。
年、月、日のパーティションを持つタイムスタンプに基づいてパーティションを作成したいと考えています。
これまでのところ、これを行っていますが、エラーがスローされています。
PARSE ERROR cannot recognize input '(' in column type
これが私のコードです。
from (
from raw_data
MAP ${PREFIX}raw_data.line
USING 's3://scripts/clean.py'
AS (timestamp STRING, name STRING)
) map_out
INSERT OVERWRITE TABLE date_base_data_temp PARTITION(year(timestamp), month(timestamp)), day(timestamp)))
select map_out.name;