次のクエリを使用してpySpark
データを処理しました。sqlContext
(sqlContext.sql("select LastUpdate,Count(1) as Count" from temp_t)
.rdd.coalesce(1).saveAsTextFile("/apps/hive/warehouse/Count"))
次の形式で格納されます。
Row(LastUpdate=u'2016-03-14 12:27:55.01', Count=1)
Row(LastUpdate=u'2016-02-18 11:56:54.613', Count=1)
Row(LastUpdate=u'2016-04-13 13:53:32.697', Count=1)
Row(LastUpdate=u'2016-02-22 17:43:37.257', Count=5)
しかし、データをHiveテーブルに保存したい
LastUpdate Count
2016-03-14 12:27:55.01 1
. .
. .
Hiveでテーブルを作成する方法は次のとおりです。
CREATE TABLE Data_Count(LastUpdate string, Count int )
ROW FORMAT DELIMITED fields terminated by '|';
多くのオプションを試しましたが、成功しませんでした。これについて私を助けてください。