XMLに複数のトップレベルアイテムがある場合、Python ElementTreeを使用してXMLファイルを読み取るにはどうすればよいですか?
PythonElementTreeを使用して読みたいXMLファイルがあります。
残念ながら、複数のトップレベルタグがあります。とフィールドの後に<doc>...</doc>
置く必要があることを除いて、XMLをラップアラウンドします。しかし、どこで終わるかを理解することは簡単ではありません。<doc>
<?xml>
<!DOCTYPE>
<!DOCTYPE>
私が持っているもの:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE FOO BAR "foo.dtd" [
<!ENTITY ...>
<!ENTITY ...>
<!ENTITY ...>
]>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
私が欲しいもの:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE FOO BAR "foo.dtd" [
<!ENTITY ...>
<!ENTITY ...>
<!ENTITY ...>
]>
<DOC>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
</DOC>
注意:タグARTICLEの名前が変わる可能性があるので、grepできません。
<doc>...</doc>
XMLヘッダーの後に囲みを追加する方法を誰かに提案したり、別の回避策を提案したりできますか?