何億ものノードを持つ超大規模なNetworkXGraphオブジェクトを処理しようとしています。コンピュータのメモリをすべて消費しないように、ファイルに書き込めるようにしたいと思います。ただし、既存のノードを常に検索したり、エッジを更新したりする必要があります。
これに対する良い解決策はありますか?http://networkx.lanl.gov/reference/readwrite.htmlで提供されているファイル形式のいずれかでどのように機能するかわかりません
私が考えることができる唯一の解決策は、各ノードをファイルシステム内の他のノードへの参照を含む個別のファイルとして保存することです。そうすれば、検査のために1つのノードを開いても、メモリが過負荷になることはありません。独自の定型コードを記述せずにこれを行うための大量のデータ(PyTablesなど)用の既存のファイルシステムはありますか?