mapreduce で PageRank を実装しようとしているときに質問があります。ここでコードを引用したいhttps://stackoverflow.com/a/5029780/1117436問題を説明します。
map ((url,PR), out_links) //PR = random at start
for link in out_links
emit(link, ((PR/size(out_links)), url))
reduce(url, List[(weight, url)):
PR =0
for v in weights
PR = PR + v
Set urls = all urls from list
emit((url, PR), urls)
上記のプロセスでは、map プロシージャの入力の 2 番目のパラメーターが url の Out リンクであることは明らかですが、reduce プロシージャの出力の 2 番目のパラメーターは url の In リンクのようです。では、これらのコードはどのように繰り返し機能するのでしょうか?
では、ページランクのアルゴリズムを適切に機能させるコードの書き方を教えてください。
更新: この回答で問題が解決すると思います。 https://stackoverflow.com/a/13568286/1117436