問題タブ [hama]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
464 参照

java - Apache Hama は決定木の構築に適していますか?

私は現在、意思決定ツリー (PLANET とも呼ばれる) を構築するための Google のフレームワークである Hadoop に実装しています。単一の頂点から開始し、map reduce ジョブを使用して、ツリーが完全に構築されるまでどんどん追加します。ただし、大きな問題の 1 つは、多数の map/reduce ジョブが次々と実行されるため、常に新しいジョブを開始するコストが非常に高くなることです。

Apache Hama がグラフのような反復アルゴリズムに適していることを何度も見てきました。誰かが Hama を使って新しいグラフを作成できますか?それとも、グラフを入力として使用し、それに基づいて計算を行うことができますか? 私のプロジェクトをハマに転送するのは簡単ですか?? ありがとう

0 投票する
1 に答える
244 参照

apache - DryadOpt (並列分岐と Bound のためのライブラリ) - availablity

並列ブランチとバインドされた BFS を実装しようとしています。Dryad LinQ の上で動作する DryadOpt の使用に興味があります。DryadOptを取得した人はいますか?アカデミック バージョンの DryadLinQ を入手できることはわかっています。これは Azure にも存在しますが、DryadOpt を入手する方法はありますか。Apache hama は並列ブランチとバインドされた BFS を処理できますか

0 投票する
0 に答える
76 参照

java - Hama BSPJob からカウンターに格納された結果を取得する方法は?

Hadoop Mapreduce と同様に、このリンクで説明されているように、Hama にもカウンターがあります。

hadoop mapreduce では、次のようにgetCounters()関数を使用してカウンターの値を簡単に取得できます。

しかし、hama のBSPJobクラスには、そのような機能はありませんgetCounters()

私の質問は: hama BSPJob が終了した後、どのようにカウンターから値を取得できますか?

ありがとうございました、

0 投票する
1 に答える
161 参照

java - Hama BSP の例外

BSP ジョブを実際に実行する前に、入力データ パーティション フェーズで hama が次の例外をスローします。この例外の考えられる根本的な原因を知ることはできますか? 根本的な原因を見つける方法についての提案は大歓迎です。ありがとうございました!

0 投票する
1 に答える
278 参照

java - Hama BSP でこのジョブのランタイム パーティションが失敗しました

hama BSP ジョブの実行を開始すると、次の問題が発生しました。この例外は、自分のコードを実際に実行する前に、hama が入力データを読み込んで分割しようとしたときに発生します。これは一部の Web サイトで説明されている既知の問題ですが、残念なことに既知の原因はありません (例:ここを参照)。

データ セットの一部のみを実行すると、BSP ジョブは問題なく動作します。ただし、完全なデータセットを実行すると、問題が発生します:(

この問題を解決または回避する方法を教えてください。

0 投票する
0 に答える
138 参照

graph - Apache hama クラスタのスケーラビリティ

Hama グラフ API を使用して Apache Hama 用にプログラミングしています。プログラムをクラスターで実行する場合、スケーラビリティーに問題があります。問題は、クラスター内のマシンの数を増やすと、実行時間が短くなると予想されますが、実行時間が長くなることです。

8500 個の頂点で構成されるグラフを使用してプログラムを実行しています。2 台のマシンのクラスターを使用する場合、ジョブは 479 秒かかり、3 台のマシンを使用する場合、ジョブは 503 秒かかり、10 台のマシンを使用する場合、ジョブは 530 秒かかります。誰かが私が欠けているものを教えてもらえますか?.

hama-site.xmlファイル内の構成の詳細は次のとおりです。

groomserversファイルの内容は次のとおりです。

私の仕事のメインメソッドには、次のコードがあります。