とRDD[T]
述語がありT => Boolean
ます。すべての項目が述語に適合するか適合しないかを計算するにはどうすればよいですか?
もちろん、私はこのようにすることができます:
rdd
.map(predicate)
.reduce(_ && _)
ただし、これを繰り返すには完全なコレクションが必要です。これはやり過ぎです。
local[1]に適した別のアプローチを試しましたが、実際のクラスターでもすべてを反復しているように見えました。
rdd
.map(predicate)
.first()
[必要なものが見つからない場合は例外で失敗します]
これを達成するための標準的な方法は何ですか?