2

data.fu には、ここでカーディナリティを推定するための HyperLogLog の優れた実装があります

ただし、これAccumulatorは、レデューサーでのみ実行され、コンバイナーでは実行されないことを意味するように実装されています (ただし、通常のようにセット全体をメモリにロードすることはありませんEvalFunc)。なぜ data.fu はそれをAlgebraic- として実装できず、すべてのコンバイナーでレジスターを埋めてから、結果をマージして削減できなかったのですか? ここで何か不足していますか?

4

1 に答える 1