次の形式の約850万のデータポイントを含むテキストファイルがあります。
Company 87178481
Company 893489
Company 2345788
[...]
Pythonを使用して接続グラフを作成し、企業間のネットワークがどのように見えるかを確認したいと思います。上記のサンプルから、2番目の列の値が同じである場合(Hookedからの/の説明)、2つの会社がエッジを共有します。
NetworkXパッケージを使用していて、数千ポイントのネットワークを生成できましたが、850万ノードのテキストファイル全体を通過できません。それを実行して約15時間放置しました。戻ったとき、シェルのカーソルはまだ点滅していましたが、出力グラフはありませんでした。
それがまだ実行されていると想定しても安全ですか?何百万ものポイントをグラフ化するためのより良い/より速く/より簡単なアプローチはありますか?