初めてpysparkを使用しています。
java と同じように、リデューサー タスクがマッパーからのキーで返される値を反復処理するようにします。
アキュムレータのオプションのみがあり、反復はありません-add関数のように add(data1,data2) => data1 はアキュムレータです。
キーに属する値のリストを入力に入れたいと思います。
それが私がやりたいことです。それを行うオプションがあるかどうか誰でも知っていますか?
初めてpysparkを使用しています。
java と同じように、リデューサー タスクがマッパーからのキーで返される値を反復処理するようにします。
アキュムレータのオプションのみがあり、反復はありません-add関数のように add(data1,data2) => data1 はアキュムレータです。
キーに属する値のリストを入力に入れたいと思います。
それが私がやりたいことです。それを行うオプションがあるかどうか誰でも知っていますか?