問題タブ [giraph]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ssh - .ppk と .pem の違いは何ですか。.pem は amazons ec2 クラスターのどこに保存されますか?
GraphLab を実行するために Amazon の EC2 クラスターを使用しています。彼ら.pem
は、私の秘密鍵であるファイルの場所を知りたがっています。
検索した後も、ubuntuでファイルが見つかりませんでした。PuTTY を使用しています。
hadoop - EMR 上の Apache Giraph
EMR で Apache Giraph を試したことがありますか?
EMR で実行するための唯一の要件は、適切なブートストラップ スクリプトをジョブ フロー構成に追加することだけだと思います。次に、標準のカスタム JAR 起動ステップを使用して、Giraph プログラムに適切な引数を指定して Giraph Runner を起動するだけです。
ドキュメンテーション/チュートリアル、または EMR で Giraph との経験を共有できる場合は、非常に高く評価されます。
giraph - giraph で着信エッジにメッセージを送信する
giraph の着信エッジにメッセージを送信する方法はありますか? または、すべての発信エッジにメッセージを送信する代わりに、特定のエッジ (タイプまたはラベルなど) を介してメッセージを送信する方法はありますか?
memory - giraph ジョブの終了後にメモリが解放されない
Hadoop バージョン 0.20.203 で Apache Giraph バージョン 1.0 を使用しています。ConnectedComponentsVertex と SimpleShortetPathsVertex、apache giraph の例、ジョブを正常に実行しますが、問題があります。ジョブが終了した後、メモリの割り当ては解除されません。システム モニターが示すように、ジョブ用に作成された Java プロセスはまだ有効です。この問題が発生した理由がわかりません。それはギラフのバグですか、それとも私が何か間違ったことをしていますか??? Ubuntu 11.10 と Java 1.6 を使用しています。どんな助けでも大歓迎です。
ありがとう
cloudera-manager - Cloudera Manager を使用して自動的に JDK1.7 をインストールする CDH のバージョンはどれですか?
3+1 クラスターに Cloudera Manager と CDH4.2.2 を使用しています。cloudera manager でインストールを開始すると、自動的に JDK1.6 をダウンロードしてインストールします。私は便宜上、CDH で JDK1.7 を使用したいと考えています。クラスタに Hadoop をインストールしているときに、JDK1.7 で Hadoop を自動的にダウンロードしてインストールし、正常に実行する CDH のバージョンはありますか?
はいの場合、CDH のバージョンとダウンロード先を教えてください。
CDH に Apache Giraph をインストールしたいので、1.6 ではなく JDK1.7 を使用したいのですが、Giraph は JDK1.6 にうまく適合せず、JDK1.7 が必要なようです。
よろしくお願いします。
hadoop - Giraph ZooKeeper ポートの問題
Giraph Quick Startで説明されている SimpleShortestPathsVertex (別名 SimpleShortestPathComputation) の例を実行しようとしています。これを VirtualBox を使用して Hortonworks Sandbox インスタンス (HDP 2.1) で実行しており、プロファイル hadoop_2.0.0 を使用して giraph.jar をパッケージ化しました。
を使用して例を実行しようとすると
次の例外が発生します
私は回避策を見つけました - Giraph は ZooKeeper がポート 22181 で実行されていることを期待しているようですが、実際には 2181 で実行されているようです。Ambari インターフェースを使用して、ZooKeeper を 22181 で実行するように設定しただけです (http://127.0.0.1:8080/
管理者/管理者にログインします)。 、[サービス] タブ、ZooKeeper でポートを 22181 に変更し、保存して [サービス アクション] -> [すべて再起動] を選択します。
誰でもこの問題のより良い解決策を持っていますか? ポートを指定する構成がありますか、または Giraph ソース コードのこのポートはタイプミスですか?
graph - 大量のデータを扱う Neo4j として Apache Giraph を使用する
2 つのノード間の最短パスを計算する Neo4j でいくつかのテストをしようとしていました。
- 10 万のノードと 1000 万のエッジ (ノードごとに 100 のエッジ) で、最短パス アルゴリズムは 0.4 ~ 3 秒で実行されました。
- 20 万のノードと 4000 万のエッジ (ノードごとに 200 のエッジ) では、少なくとも 40 秒以上かかります。
私のコンピューターは明らかにビッグデータ分析用ではありませんが、128 GB の RAM を搭載したサーバーを購入し、さらに多くのプロセッサを購入して、妥当な時間内に 2 番目のテストを解決できるかどうかさえわかりません。(できると思いますか?)
確かに 100 万ノード以上になると、neo4j はもはや役に立たなくなります。Neo4J のような Giraph を使用する方法をオンラインで探すのに何時間も費やしました。クエリを実行して結果を出力できる何らかの API (Java でも) を持っています。しかし、何も..
前もって感謝します