data.fu には、ここでカーディナリティを推定するための HyperLogLog の優れた実装があります
ただし、これAccumulator
は、レデューサーでのみ実行され、コンバイナーでは実行されないことを意味するように実装されています (ただし、通常のようにセット全体をメモリにロードすることはありませんEvalFunc
)。なぜ data.fu はそれをAlgebraic
- として実装できず、すべてのコンバイナーでレジスターを埋めてから、結果をマージして削減できなかったのですか? ここで何か不足していますか?