2 つのノード間の最短パスを計算する Neo4j でいくつかのテストをしようとしていました。
- 10 万のノードと 1000 万のエッジ (ノードごとに 100 のエッジ) で、最短パス アルゴリズムは 0.4 ~ 3 秒で実行されました。
- 20 万のノードと 4000 万のエッジ (ノードごとに 200 のエッジ) では、少なくとも 40 秒以上かかります。
私のコンピューターは明らかにビッグデータ分析用ではありませんが、128 GB の RAM を搭載したサーバーを購入し、さらに多くのプロセッサを購入して、妥当な時間内に 2 番目のテストを解決できるかどうかさえわかりません。(できると思いますか?)
確かに 100 万ノード以上になると、neo4j はもはや役に立たなくなります。Neo4J のような Giraph を使用する方法をオンラインで探すのに何時間も費やしました。クエリを実行して結果を出力できる何らかの API (Java でも) を持っています。しかし、何も..
前もって感謝します