2

数百万のエッジを持つ大きなグラフを保存して視覚化する最も効率的な方法を知っている人はいますか?

Gephiを知っています。しかし、そのようなビッグデータセットを視覚化することはできません(少なくとも4Gメモリを搭載した私のラップトップでは。常にクラッシュするか、メモリが不足しています)。他のソフトウェアで処理できますか?または、そのようなビッグデータセットを視覚化するためのGephiに関する他のトリックがあるかもしれません。

私はpythonlib、NetworkXを使用してグラフを処理しますが、これはうまく機能します。しかし、グラフの保存は別の問題です。これまでのところ、グラフを保存するためにテキストファイルとバイナリファイルのピクルスを使用しています。それは結構です。しかし、私の研究には、ノードペア間の計算も含まれています。これは最大1億ペアになる可能性があります。それらの計算には時間がかかりますが、それらの保存とクエリにはもっと時間がかかるようです。Postgreのような従来のデータベースを試しましたが、ストアとクエリの両方で非常に時間がかかります。グラフデータを保存するためのNoSQLデータベースNeo4jも試してみましたが、グラフ全体と計算結果をグラフにダンプするのは非常に時間がかかります。データの2/5を保存するのに約20時間かかりましたが、どこからともなくエラーが発生しました。誰かがこれを取り除くために私にいくつかの他の強力なツールを勧めてもらえますか?

さらに、上司から、グラフ上に私の研究結果のオンライン視覚化バージョンを作成するように依頼されました。グラフの以前の経験から、一般的なjsライブラリがそのようなビッグデータセットを処理できるとは思いません。視覚化と相互作用のためにデータの階層を構築する必要があることは知っていますが、DBからブラウザー側のライブラリまでどのようなアーキテクチャまたはフレームワークを採用する必要がありますか?

PS私は元々のコンピュータサイエンスの人ではないので、テクニックに関する私の知識は限られており、用語の誤用は避けられないかもしれません。

どんな提案も歓迎します。

4

0 に答える 0