time
フィールドが のように見え2013-01-01T00:00:00.000Z
、piggybank.jar
すでにインポートされ、コマンドが定義されていると仮定するとEXTRACT
(DEFINE EXTRACT org.apache.pig.piggybank.evaluation.string.EXTRACT();) フィールドを抽出する最良の方法は何year, month, day, hour, minute, second
ですか? それが私がこれまで行ってきたことです:
data = FOREACH data GENERATE FLATTEN(EXTRACT(time, '(\\d+)-(\\d+)-(\\d+)T(\\d+):(\\d+):(\\d+).(\\s+)'))
AS (
year: int,
month: int,
day: int,
hour: int,
minute: int,
second: int,
tail: chararray
);