現在、更新または削除するために、テーブル全体をデータフレームにロードし、更新して新しいデータフレームとして保存し、これを上書きモードで保存しています(以下はコマンドです)。テーブル全体のデータを読み込んで処理する必要がありますか??
objHiveContext.sql("update myTable set columnName='' ") を実行できません。Spark 1.4.1、Hive 1.2.1 を使用しています。
myData.write.format("orc").mode(SaveMode.Overwrite).saveAsTable("myTable")
myData は更新されたデータフレームです。
ハイブ テーブルの 1 つのレコードを更新するためだけに、200 万から 300 万のレコード全体をロードする必要をなくすにはどうすればよいでしょうか。