単語のセットがありN
、それらのセットからマップを作成して、これらすべてのセット内の単語の出現数に単語をマップするとします。
例えば:
N = 3 S1 = {"a", "b", "c"}, S2 = {"a", "b", "d"}, S3 = {"a", "c", "e"} M = { "a" -> 3, "b" -> 2, "c" -> 2, "d" -> 1, "e" -> 1}
今、私はM
使用するコンピュータを持っています。N/M
したがって、各コンピューターにセットからマップを作成させることができます。第 2 (最終) フェーズでは、マップからマップを作成できM
ます。のように見えmap/reduce
ます。それは理にかなっていますか?このアプローチをどのように改善しますか?