次のようなテーブルがあります。
現在のデータフレーム/テーブル: 'original_table'
col_1 col_2 col_3
0 Non-Saved www.google.com 10
1 Non-Saved www.facebook.com 20
2 Non-Saved www.linkedin.com 20
3 Saved www.Quora.com 30
4 Saved www.gmail.com 40
SQLクエリを使用して次のようなテーブルを導出できますか?
col_1 col_2 col_3
0 Non-Saved www.google.com 50
www.facebook.com
www.linkedin.com
1 Saved www.Quora.com 70
www.gmail.com
基本的に、テーブルが col_1 からの DISTINCT 値、col_2 からのすべての対応する値、および col_3 からの対応する値の SUM(col_3) を 1 つの行に持つことを期待しています。
私のクエリ:
sql("""SELECT col_1, group_concat(col_2) as col_2, SUM(col_3) as col_3
FROM original_table
GROUP BY col_1
""").show()
group_concatを使用して埋め込み SQL クエリを使用しようとしましたが、次のエラーが表示されます。
AnalysisException: u"Undefined function: 'GROUP_CONCAT'. This function
is neither a registered temporary function nor a permanent function
registered in the database 'default'.
誰かがおそらく簡単なハックで私を助けてくれますか?