0

現在、更新または削除するために、テーブル全体をデータフレームにロードし、更新して新しいデータフレームとして保存し、これを上書きモードで保存しています(以下はコマンドです)。テーブル全体のデータを読み込んで処理する必要がありますか??

objHiveContext.sql("update myTable set columnName='' ") を実行できません。Spark 1.4.1、Hive 1.2.1 を使用しています。

myData.write.format("orc").mode(SaveMode.Overwrite).saveAsTable("myTable") myData は更新されたデータフレームです。

ハイブ テーブルの 1 つのレコードを更新するためだけに、200 万から 300 万のレコード全体をロードする必要をなくすにはどうすればよいでしょうか。

4

0 に答える 0