scala - テーブル全体をデータフレームにロードせずに、 spark からハイブテーブルのレコードを更新または削除するにはどうすればよいですか?

翻译自：https://stackoverflow.com/questions/34634547 2016-01-06T13:39:34.177

1697 次

現在、更新または削除するために、テーブル全体をデータフレームにロードし、更新して新しいデータフレームとして保存し、これを上書きモードで保存しています（以下はコマンドです）。テーブル全体のデータを読み込んで処理する必要がありますか??

objHiveContext.sql("update myTable set columnName='' ") を実行できません。Spark 1.4.1、Hive 1.2.1 を使用しています。

myData.write.format("orc").mode(SaveMode.Overwrite).saveAsTable("myTable") myData は更新されたデータフレームです。

ハイブテーブルの 1 つのレコードを更新するためだけに、200 万から 300 万のレコード全体をロードする必要をなくすにはどうすればよいでしょうか。

0 に答える 0