python - PythonでxmlのCDATAを解析する

Question

後でプロットするために保持する必要がある CDATA の多数のブロックを含む XML ファイルを解析する必要があります。

<process id="process1"> <log name="name1" device="device1"><![CDATA[timestamp value]]]></log> <log name="name2" device="device2"><![CDATA[timestamp value, timestamp value, timestamp]]]></log> </process>

これを繰り返し迅速に行う必要があり、これを行うための最良の方法を探しています。ElementTree の方がメソッドが高速であると読みましたが、他の提案も受け付けています。

score 15 · Accepted Answer

これを行う方法の 2 つの例を次に示します。

from lxml import etree
import xml.etree.ElementTree as ElementTree

CONTENT = """
<process id="process1">
 <log name="name1" device="device1"><![CDATA[timestamp value]]></log>
 <log name="name2" device="device2"><![CDATA[timestamp value, timestamp value, timestamp]]></log>
</process>
"""

def parse_with_lxml():
    root = etree.fromstring(CONTENT)
    for log in root.xpath("//log"):
        print log.text

def parse_with_stdlib():
    root = ElementTree.fromstring(CONTENT)
    for log in root.iter('log'):
        print log.text

if __name__ == '__main__':
    parse_with_lxml()
    parse_with_stdlib()

出力：

timestamp value
timestamp value, timestamp value, timestamp
timestamp value
timestamp value, timestamp value, timestamp

どちらの場合もそれを処理するテキスト属性。

python - PythonでxmlのCDATAを解析する

1 に答える 1

Related

Reference