増分ログ データを格納できる内部 (マネージド) テーブルをハイブに作成しようとしています。表は次のようになります。
CREATE TABLE logs (foo INT, bar STRING, created_date TIMESTAMP)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '<=>'
STORED AS TEXTFILE;
このテーブルに定期的にデータをロードする必要があります。
LOAD DATA INPATH '/user/foo/data/logs' INTO TABLE logs;
しかし、データがテーブルに正しく挿入されていません。区切り文字に問題がある可能性があります。理由が見つかりません。
ログ行の例:
120<=>abcdefg<=>2016-01-01 12:14:11
わかっselect * from logs;
たら、
120 =>abcdefg NULL
最初の属性は問題ありません。2 番目の属性には区切り文字の一部が含まれていますが、挿入されるのは文字列であるため、3 番目の属性は日時を想定しているため null になります。
カスタム区切り文字を提供してデータを正常にロードする方法について、誰でも助けてください。