次のようにCSVファイルをHiveテーブルに読み込もうとしています。
CREATE TABLE mytable
(
num1 INT,
text1 STRING,
num2 INT,
text2 STRING
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ",";
LOAD DATA LOCAL INPATH '/data.csv'
OVERWRITE INTO TABLE mytable;
csvはコンマ(、)で区切られ、次のようになります。
1, "some text, with comma in it", 123, "more text"
最初の文字列に「、」があるため、これは破損したデータを返します。
テキスト区切り文字を設定したり、Hiveに文字列の「、」を無視させる方法はありますか?
csvは外部ソースから取得されるため、区切り文字を変更できません。