問題タブ [giraph]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
37069 参照

ssh - .ppk と .pem の違いは何ですか。.pem は amazons ec2 クラスターのどこに保存されますか?

GraphLab を実行するために Amazon の EC2 クラスターを使用しています。彼ら.pemは、私の秘密鍵であるファイルの場所を知りたがっています。

検索した後も、ubuntuでファイルが見つかりませんでした。PuTTY を使用しています。

0 投票する
1 に答える
1120 参照

hadoop - EMR 上の Apache Giraph

EMR で Apache Giraph を試したことがありますか?

EMR で実行するための唯一の要件は、適切なブートストラップ スクリプトをジョブ フロー構成に追加することだけだと思います。次に、標準のカスタム JAR 起動ステップを使用して、Giraph プログラムに適切な引数を指定して Giraph Runner を起動するだけです。

ドキュメンテーション/チュートリアル、または EMR で Giraph との経験を共有できる場合は、非常に高く評価されます。

0 投票する
1 に答える
337 参照

giraph - giraph で着信エッジにメッセージを送信する

giraph の着信エッジにメッセージを送信する方法はありますか? または、すべての発信エッジにメッセージを送信する代わりに、特定のエッジ (タイプまたはラベルなど) を介してメッセージを送信する方法はありますか?

0 投票する
1 に答える
110 参照

memory - giraph ジョブの終了後にメモリが解放されない

Hadoop バージョン 0.20.203 で Apache Giraph バージョン 1.0 を使用しています。ConnectedComponentsVertex と SimpleShortetPathsVertex、apache giraph の例、ジョブを正常に実行しますが、問題があります。ジョブが終了した後、メモリの割り当ては解除されません。システム モニターが示すように、ジョブ用に作成された Java プロセスはまだ有効です。この問題が発生した理由がわかりません。それはギラフのバグですか、それとも私が何か間違ったことをしていますか??? Ubuntu 11.10 と Java 1.6 を使用しています。どんな助けでも大歓迎です。

ありがとう

0 投票する
1 に答える
193 参照

cloudera-manager - Cloudera Manager を使用して自動的に JDK1.7 をインストールする CDH のバージョンはどれですか?

3+1 クラスターに Cloudera Manager と CDH4.2.2 を使用しています。cloudera manager でインストールを開始すると、自動的に JDK1.6 をダウンロードしてインストールします。私は便宜上、CDH で JDK1.7 を使用したいと考えています。クラスタに Hadoop をインストールしているときに、JDK1.7 で Hadoop を自動的にダウンロードしてインストールし、正常に実行する CDH のバージョンはありますか?

はいの場合、CDH のバージョンとダウンロード先を教えてください。

CDH に Apache Giraph をインストールしたいので、1.6 ではなく JDK1.7 を使用したいのですが、Giraph は JDK1.6 にうまく適合せず、JDK1.7 が必要なようです。

よろしくお願いします。

0 投票する
1 に答える
738 参照

hadoop - Giraph ZooKeeper ポートの問題

Giraph Quick Startで説明されている SimpleShortestPathsVertex (別名 SimpleShortestPathComputation) の例を実行しようとしています。これを VirtualBox を使用して Hortonworks Sandbox インスタンス (HDP 2.1) で実行しており、プロファイル hadoop_2.0.0 を使用して giraph.jar をパッケージ化しました。

を使用して例を実行しようとすると

次の例外が発生します

私は回避策を見つけました - Giraph は ZooKeeper がポート 22181 で実行されていることを期待しているようですが、実際には 2181 で実行されているようです。Ambari インターフェースを使用して、ZooKeeper を 22181 で実行するように設定しただけです (http://127.0.0.1:8080/管理者/管理者にログインします)。 、[サービス] タブ、ZooKeeper でポートを 22181 に変更し、保存して [サービス アクション] -> [すべて再起動] を選択します。

誰でもこの問題のより良い解決策を持っていますか? ポートを指定する構成がありますか、または Giraph ソース コードのこのポートはタイプミスですか?

0 投票する
0 に答える
332 参照

graph - 大量のデータを扱う Neo4j として Apache Giraph を使用する

2 つのノード間の最短パスを計算する Neo4j でいくつかのテストをしようとしていました。

  1. 10 万のノードと 1000 万のエッジ (ノードごとに 100 のエッジ) で、最短パス アルゴリズムは 0.4 ~ 3 秒で実行されました。
  2. 20 万のノードと 4000 万のエッジ (ノードごとに 200 のエッジ) では、少なくとも 40 秒以上かかります。

私のコンピューターは明らかにビッグデータ分析用ではありませんが、128 GB の RAM を搭載したサーバーを購入し、さらに多くのプロセッサを購入して、妥当な時間内に 2 番目のテストを解決できるかどうかさえわかりません。(できると思いますか?)

確かに 100 万ノード以上になると、neo4j はもはや役に立たなくなります。Neo4J のような Giraph を使用する方法をオンラインで探すのに何時間も費やしました。クエリを実行して結果を出力できる何らかの API (Java でも) を持っています。しかし、何も..

前もって感謝します