36

csv ファイルからデータフレームに読み込むサンプル アプリケーションがあります。メソッドを使用して、データフレームを寄木細工形式で Hive テーブルに格納できます df.saveAsTable(tablename,mode)

上記のコードは問題なく動作しますが、作成日 (テーブルの列) に基づいてハイブ テーブルを動的に分割したい毎日のデータが非常に多いためです。

データフレームを動的に分割してハイブ ウェアハウスに格納する方法はありますか。を使用して挿入ステートメントをハードコーディングすることは控えたいhivesqlcontext.sql(insert into table partittioin by(date)....)

質問は拡張機能と見なすことができます: DataFrame を Hive に直接保存する方法は?

どんな助けでも大歓迎です。

4

7 に答える 7

40

を使用してパーティション化されたハイブテーブルに書き込むことができましたdf.write().mode(SaveMode.Append).partitionBy("colname").saveAsTable("Table")

機能させるには、次のプロパティを有効にする必要がありました。

hiveContext.setConf("hive.exec.dynamic.partition", "true")
hiveContext.setConf("hive.exec.dynamic.partition.mode", "nonstrict")
于 2016-02-25T08:06:38.447 に答える