提供したデータは多かれ少なかれs式です。これが取り込みたい形式であるとすると、pyparsing(Pythonモジュール)にはs-expressionパーサーがあります。
グラフライブラリも必要です。私はほとんどの仕事にnetworkxを使用しています。pyparsing s-expressionパーサーとnetworkxを使用すると、次のコードがデータを取り込み、有向グラフとしてツリーを作成します。
import networkx as nx
def build(g, X):
if isinstance(X, list):
parent = X[0]
g.add_node(parent)
for branch in X[1:]:
child = build(g, branch)
g.add_edge(parent, child)
return parent
if isinstance(X, basestring):
g.add_node(X)
return X
#-- The sexp parser is constructed by the code example at...
#-- http://http://pyparsing.wikispaces.com/file/view/sexpParser.py
sexpr = sexp.parseString("(A (B1 C1 C2) B2)", parseAll = True)
#-- Get the parsing results as a list of component lists.
nested = sexpr.asList( )
#-- Construct an empty digraph.
dig = nx.DiGraph( )
#-- build the tree
for component in nested:
build(dig, component)
#-- Write out the tree as a graphml file.
nx.write_graphml(dig, 'tree.graphml', prettyprint = True)
これをテストするために、ツリーを.dotファイルとして記述し、graphvizを使用して次のイメージを作成しました。
networkxは優れたグラフライブラリであり、必要に応じて、ツリー上を移動してエッジまたはノードに追加のメタデータをタグ付けする追加のコードを記述できます。