scala - Spark RDD any() および all() メソッド?

翻译自：https://stackoverflow.com/questions/26550420 2014-10-24T14:49:49.727

1209 次

とRDD[T]述語がありT => Booleanます。すべての項目が述語に適合するか適合しないかを計算するにはどうすればよいですか?

もちろん、私はこのようにすることができます：

rdd
 .map(predicate)
 .reduce(_ && _)

ただし、これを繰り返すには完全なコレクションが必要です。これはやり過ぎです。

local[1]に適した別のアプローチを試しましたが、実際のクラスターでもすべてを反復しているように見えました。

rdd
 .map(predicate)
 .first()

[必要なものが見つからない場合は例外で失敗します]

これを達成するための標準的な方法は何ですか?

1 に答える 1