2

私は現在、意思決定ツリー (PLANET とも呼ばれる) を構築するための Google のフレームワークである Hadoop に実装しています。単一の頂点から開始し、map reduce ジョブを使用して、ツリーが完全に構築されるまでどんどん追加します。ただし、大きな問題の 1 つは、多数の map/reduce ジョブが次々と実行されるため、常に新しいジョブを開始するコストが非常に高くなることです。

Apache Hama がグラフのような反復アルゴリズムに適していることを何度も見てきました。誰かが Hama を使って新しいグラフを作成できますか?それとも、グラフを入力として使用し、それに基づいて計算を行うことができますか? 私のプロジェクトをハマに転送するのは簡単ですか?? ありがとう

4

1 に答える 1

2

Hama は実際、PLANET の論文で説明されているアルゴリズムを使用して、MapReduce よりもはるかに効率的な方法で決定木を構築できます。

Hama は入力としてグラフを必要としません。Hama ML (機械学習) モジュールを見ることができます。Hama ML (機械学習) モジュールは、通常、生の特徴ベクトルを HDFS から直接入力として処理します。

Hama のために、このアルゴリズムの進捗状況を追跡するために Apache Jira に新しい課題を作成しました。

于 2012-10-14T09:14:18.770 に答える