問題タブ [tpc]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
apache-spark - 集約とグループ化の両方を使用する PySpark
集約関数と groupby 関数の両方を使用して pyspark を手伝ってくれる人はいますか? データ フレームを作成し、必要なデータを取得するためにフィルターと選択を適用しました。しかし、私は物事を正しく集約しようとして立ち往生しています。
現在、私のコードは以下のコンテンツを出力します:
l_orderkey でグループを適用し、Rev を合計として集計したいと考えています。
これは、「t」がデータフレームで、Fがpyspark.sqlの関数である私の最近の試みです"from pyspark.sql import functions as F"
私が正しい軌道に乗っているかどうかを誰かが教えてくれますか? 「列は反復可能ではありません」というメッセージが表示され続けます