特にHadoopによって実装されたMapReduceフレームワークについてまだ学んでおり、次のタスクを実行するように変更できるかどうか疑問に思っています:
Map() 関数は、キーがサイズ 2 の配列、たとえば int[2] である (key,value) ペアを出力します。共通の 2 つの整数のいずれかを含むすべてのペアを同じレデューサーにマップしたいと思います。
たとえば、Map() が ([2,3],4),([2,4],5),([6,5],2),([5,7],1),次に、Reduce1 は最初の 2 つのペアを受け取り、Reduce2 は次の 2 つのペアを受け取る必要があります (最初の 2 つは 2 を共有し、2 番目の 2 つは 5 を共有します)。これは、頂点が int[] 内の整数であり、エッジが同じ int[] 内の任意の 2 つの整数間で共有される連結成分の問題と見なすことができます。