hadoop - PageRankBenchmark - 0% で削減 - Giraph の例

Question

次の方法で、PageRankBenchmark の例を使用して、単一ノードクラスター Giraph インストールをテストしています。

$HADOOP_HOME/bin/hadoop jar   /usr/local/hadoop/share/hadoop/mapreduce/giraph-examples-1.1.0-for-hadoop-2.4.0-jar-with-dependencies.jar org.apache.giraph.benchmark.PageRankBenchmark -v -V 1000 -e 1 -s 5 -w 1

しかし、マッパーがジョブを完了した後、レデューサーは開始しません (コンソールによると、マップ 100% は 0% を減らします)。これは、このアルゴリズムの適切な動作ですか?

マッパーが実行された場合、リデューサーはマップの出力を入力として取り始め、作業を終了する必要があります (少なくとも、インターネットの PageRank アルゴリズムの他の多くの実装では、常に「リデューサー」が存在します)。しかし、私はそれをグーグルで検索し、他の人が実行したこのアルゴリズムのいくつかの結果で、PageRankBenchmark giraph の例は常に Reduce at 0% で終わります。

それで、PageRankBenchmark でそれが問題ないかどうかはわかりません。誰かが私を助けてくれることを願っています ;)

私は Hadoop 2.4 と Phadoop_yarn プロファイル、および Giraph 1.1.0 を使用しています。

私が読んだ他のいくつかの質問によると、「0％スタックを減らす」問題の主な問題は、おそらくマッパーログにありますが、そこには何も見つかりません（それらも添付しています）。

ここに私のログがあります：

乾杯！

hadoop - PageRankBenchmark - 0% で削減 - Giraph の例

1 に答える 1

Related

Reference