6

ページランクアルゴリズムのコードを作成しようとしています。主な複雑さは行列の乗算を効率的に解決することですが、このタスクがどのように実行されるか理解できませんでした。それに関するいくつかの論文を読みましたが、それは私の範囲を超えています。 。私は彼が適用する概念を理解していませんでした。では、行列乗算のマッパー関数とレデューサー関数の背後にある概念を教えてください。前もって感謝します。

このリンクを読んだ

4

3 に答える 3

1

Apache Hamaのようないくつかのフレームワークには、PageRankが実装されています。Apache GiraphはPagerankもサポートしています。

MapReduce は PageRank にはあまり適していないため、Googleは大規模なグラフ コンピューティングに関する Pregel の論文を公開しました。

于 2012-10-03T12:10:23.223 に答える
1

The idea is that you can break matrix multiplication into subproblems with something like the Strassen Algorithm and then send those subproblems to a bunch of different computers. Once those subproblems are finished the summing together of the different subproblems into the matrix itsself can also be handled with. The key to using Mapreduce is that all of the subproblems can basically be computed in parallel, which is... what Mapreduce is for.

于 2012-09-26T16:16:03.583 に答える
-2

The link you provided explains this as clear as anything (plus it includes source-code). If you're still struggling with the concepts of the operations, then you should probably start by reading up some more on matrix/linear algebra, so you understand the underlying mathematics.

于 2012-09-26T07:22:03.237 に答える