私は Giraph 1.2.0 の動作を理解しようとしている初心者です。Hadoop 1.2.1 で。
各マッパーによって処理された頂点の数を把握する方法はありますか?
org.apache.giraph.graph.ComputeCallable クラスの call メソッドは、スーパーステップごとに 1 回実行されます。この関数内で、この map タスクが所有する各パーティションに対して、computePartition 関数が呼び出されます。したがって、このクラスに整数 (カウンター) を簡単に定義できます。次に、computePartition で、頂点の compute メソッドが呼び出されると、カウンターをインクリメントします。最後に、call メソッドの最後にカウンターを出力します。したがって、各マッパーのスーパーステップごとに、処理された頂点の数が出力されます。