ハイブテーブルに必要な5つのフィールドをセミコロンで区切った1つの(最初の)列/セルを持つ形式の.csvファイルがあります。そのようです:
ISBN;"Title";"Author";"Year";"Publisher"
0002005018;"Clara Callan";"Richard Bruce Wright";"2001";"HarperFlamingo Canada"
0399135782;"The Kitchen God's Wife";"Amy Tan";"1991";"Putnam Pub Group"
etc.
etc.
...
Hive クエリを使用してデータを ; で分割できますか? 同じ順序の列名で作成したテーブルに保存しますか?
regexp_extract のような?または、serdeを使用する必要がありますか?
Hadoop/hive/beeswax は初めてで、Cloudera-quickstart vm 5.2 を使用しています。