次のようなXMLがあるとします。
<graph label="Test" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:cy="http://www.cytoscape.org" xmlns="http://www.cs.rpi.edu/XGMML" directed="1">
<foo>...</foo>
</graph>
すべての属性を持つ最初の要素名はすべて1行に表示されます。
lxmlを使用して、次のようなコードで要素ツリーをきれいに印刷する方法を見てきました。
from lxml import etree
...
def prettyPrintXml(filePath):
assert filePath is not None
parser = etree.XMLParser(resolve_entities=False, remove_blank_text=True,
strip_cdata=False)
document = etree.parse(filePath, parser)
print(etree.tostring(document, pretty_print=True, encoding='utf-8'))
...しかし、それを使用すると、すべての要素が1行に表示されます。
たとえば、行の長さが80文字を超えないように、要素属性の間に改行を挿入するようにきれいなプリンターに指示する魔法の呪文はありますか?
結果を次のようにしたいと思います。
<graph label="Test"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:xlink="http://www.w3.org/1999/xlink"
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:cy="http://www.cytoscape.org"
xmlns="http://www.cs.rpi.edu/XGMML" directed="1">
<foo>...</foo>
</graph>
subprocess
ps:私は頼りたくないxmllint