次の形式の有向グラフのデータがあります
Node1 Node2
A B
A C
C A
D A
つまり、A --> B、A --> C などの間の有向エッジ/リンクです。このデータを、Python でモデリングするために Networkx でサポートされているデータセットに作成したいと考えています。ファイルサイズをできるだけ小さくしたい。約 100 万のエッジ/リンクがあります。
import networkx as nx
import matplotlib.pyplot as plt
content = '''\
Node1 Node2
A B
A C
C A
D A'''
lines = content.splitlines()
G = nx.DiGraph()
for line in lines[1:]: # skip the first (header) line
a, b = map(str.strip, line.split())
G.add_edge(a, b)
nx.draw(G)
plt.savefig('/tmp/graph.png')
# plt.show()