apache-spark - Spark 構造化ストリーミングでの複数の集計

Question

Spark Structured Streaming で複数の集計を行いたいと考えています。

このようなもの：

これを構造化ストリーミングで実行すると、「ストリーミングデータフレーム/データセットでは複数のストリーミングアグリゲーションはサポートされていません」というエラーが表示されます。

構造化ストリーミングでこのような複数の集計を行う方法はありますか?

score 0 · Accepted Answer

spark 2.2 以降 (以前のバージョンについては不明) では、集計を追加モードでflatMapGroupWithStateを使用するように設計できれば、必要な数の集計を行うことができます。制限はここに記載されていますSpark 構造化ストリーミング - 出力モード

8 に答える 8