次のコードを使用して、給与がしきい値を超えている人の平均年齢を取得しています。
dataframe.filter(df['salary'] > 100000).agg({"avg": "age"})
列 age は数値 (float) ですが、それでもこのエラーが発生します。
py4j.protocol.Py4JJavaError: An error occurred while calling o86.agg.
: scala.MatchError: age (of class java.lang.String)
groupBy
関数や SQL クエリを使用せずに平均などを取得する他の方法を知っていますか。