(String, Int)
タプルを含む dstream があります
を試してみるとcombineByKey
、パラメータを指定するように言われます: Partitioner
my_dstream.combineByKey(
(v) => (v,1),
(acc:(Int, Int), v) => (acc._1 + v, acc._2 + 1),
(acc1:(Int, Int), acc2:(Int, Int)) => (acc1._1 + acc2._1, acc1._2 + acc2._2)
)
ただし、rdd で使用すると、正しく動作します。
my_dstream.foreachRDD( rdd =>
rdd.combineByKey(
(v) => (v,1),
(acc:(Int, Int), v) => (acc._1 + v, acc._2 + 1),
(acc1:(Int, Int), acc2:(Int, Int)) => (acc1._1 + acc2._1, acc1._2 + acc2._2)
))
このパーティショナーはどこで入手できますか?