問題タブ [pyspark-dataframes]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
94 参照

python - Pyspark データフレームの値 (リスト) を比較する

list_id 列の 2 つの df1 df2 データフレームを比較したいと思います。

望ましい結果は次のとおりです。

私の目的は、交点が空でないリストを連結し、pyspark を使用して他のリストをそのまま保持することです。

注: データフレームが非常に大きいため、Spark Sql との結合を使用することはできません。