-1

私の質問は本当に簡単です。

ハイブ テーブルを SQL Server にエクスポートするために pyspark を使用しています。

SQL Server で列名を行としてエクスポートしたことがわかりました。

列名なしでやりたいだけです。

ここに画像の説明を入力

これらの列をテーブルに入れたくありません...

ここに私のpysparkコード:

df.write.jdbc("jdbc:sqlserver://10.8.12.10;instanceName=sql1", "table_name", "overwrite", {"user": "user_name", "password": "111111", "database": "Finance"})

列名をスキップするオプションはありますか?

4

1 に答える 1

1

JDBC コネクタは、実際にはこれらのヘッダー行を追加するものではないと思います。ヘッダーは Dataframe に既に存在します。これは、Hive テーブルからデータを読み取る際の既知の問題です。

SQL を使用して Hive からデータをロードしている場合は、条件でヘッダーをフィルタリングしてみてくださいcol != 'col'

# adapt the condition by verifiying what is in  df.show()    
df = spark.sql("select * from my_table where sold_to_party!='Sold-To Party'") 
于 2019-12-14T00:19:55.897 に答える