次の方法で、PageRankBenchmark の例を使用して、単一ノード クラスター Giraph インストールをテストしています。
$HADOOP_HOME/bin/hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/giraph-examples-1.1.0-for-hadoop-2.4.0-jar-with-dependencies.jar org.apache.giraph.benchmark.PageRankBenchmark -v -V 1000 -e 1 -s 5 -w 1
しかし、マッパーがジョブを完了した後、レデューサーは開始しません (コンソールによると、マップ 100% は 0% を減らします)。これは、このアルゴリズムの適切な動作ですか?
マッパーが実行された場合、リデューサーはマップの出力を入力として取り始め、作業を終了する必要があります (少なくとも、インターネットの PageRank アルゴリズムの他の多くの実装では、常に「リデューサー」が存在します)。しかし、私はそれをグーグルで検索し、他の人が実行したこのアルゴリズムのいくつかの結果で、PageRankBenchmark giraph の例は常に Reduce at 0% で終わります。
それで、PageRankBenchmark でそれが問題ないかどうかはわかりません。誰かが私を助けてくれることを願っています ;)
私は Hadoop 2.4 と Phadoop_yarn プロファイル、および Giraph 1.1.0 を使用しています。
私が読んだ他のいくつかの質問によると、「0%スタックを減らす」問題の主な問題は、おそらくマッパーログにありますが、そこには何も見つかりません(それらも添付しています)。
ここに私のログがあります:
乾杯!