5

私はこの種のXML構造(JSONから変換されたEsprima ASLからの出力)を持っていますが、これよりもさらにネストすることができます(ASL.xml):

<?xml version="1.0" encoding="UTF-8" ?>
    <program>
    <type>Program</type>
    <body>
        <type>VariableDeclaration</type>
        <declarations>
            <type>VariableDeclarator</type>
            <id>
                <type>Identifier</type>
                <name>answer</name>
            </id>
            <init>
                <type>BinaryExpression</type>
                <operator>*</operator>
                <left>
                    <type>Literal</type>
                    <value>6</value>
                </left>
                <right>
                    <type>Literal</type>
                    <value>7</value>
                </right>
            </init>
        </declarations>
        <kind>var</kind>
    </body>
    </program> 

通常、XMLではroot.childNodes`を使用しfor node inますが、これは直接の子に対してのみ機能します。

import xml.dom.minidom as  md
dom = md.parse("ASL.xml")
root = dom.documentElement
for node in root.childNodes:
    if node.nodeType == node.ELEMENT_NODE:
        print node.tagName,"has value:",  node.nodeValue:, "and is child of:",node.parentNode.tagName 

ネストされた要素の数に関係なく、XMLのすべての要素をウォークするにはどうすればよいですか?

4

3 に答える 3

9

これはおそらく、再帰関数を使用して実現するのが最適です。このようなものでうまくいくはずですが、テストしていないので疑似コードと考えてください。

import xml.dom.minidom as  md

def print_node(root):
    if root.childNodes:
        for node in root.childNodes:
           if node.nodeType == node.ELEMENT_NODE:
               print node.tagName,"has value:",  node.nodeValue, "and is child of:", node.parentNode.tagName
               print_node(node)

dom = md.parse("ASL.xml")
root = dom.documentElement
print_node(root)
于 2012-10-01T10:37:25.747 に答える
2

xml.dom.minidomを使用することが重要でない場合:

import xml.etree.ElementTree as ET
tree = ET.fromstring("""...""")
for  elt in tree.iter():
    print "%s: '%s'" % (elt.tag, elt.text.strip())

出力:

program: ''
type: 'Program'
body: ''
type: 'VariableDeclaration'
declarations: ''
type: 'VariableDeclarator'
id: ''
type: 'Identifier'
name: 'answer'
init: ''
type: 'BinaryExpression'
operator: '*'
left: ''
type: 'Literal'
value: '6'
right: ''
type: 'Literal'
value: '7'
kind: 'var'
于 2012-10-01T11:07:32.697 に答える
1

kalgasnik の Elementree コードに相当する 2.6+ については、iter() を getiterator() に置き換えるだけです。

import xml.etree.ElementTree as ET
tree = ET.fromstring("""...""")
for  elt in tree.getiterator():
    print "%s: '%s'" % (elt.tag, elt.text.strip())
于 2014-05-08T23:40:58.480 に答える