問題タブ [pyspark-dataframes]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
123525 参照

python - PySpark のデータフレームから重複を削除する

ローカルで pyspark 1.4 のデータフレームをいじっていて、dropDuplicatesメソッドを機能させるのに問題があります。エラーを返し続けます:

「AttributeError: 'list' オブジェクトに属性 'dropDuplicates' がありません」

最新のドキュメントの構文に従っているように見えるので、その理由はよくわかりません。

0 投票する
22 に答える
139731 参照

python - sparkで列の量が異なる2つのDataFrameでユニオンを実行する方法は?

私には2つDataFrameのsがあります:

ソースデータ

私はこのような組合が必要です:

ここに画像の説明を入力

列のunionAll数と名前が異なるため機能しません。

これどうやってするの?