0

次のテキストがあります。

xml = '''
<accessibility_info>
    <accessibility role="captions" available="true" />
</accessibility_info>
<crew_member billing="top"
    <display_name>John Viscount</display_name>
</crew_member>
<products>
    <territory>GB</territory>
</products>'''

次の<crew_member>ブロックを削除する必要があります。これは私が現在行っていることです:

clean_xml = re.sub('<crew_member>.*</crew_member>', '', metadata_contents, 
                    flags=re.DOTALL)

ただし、改行も追加しています。

<accessibility_info>
    <accessibility role="captions" available="true" />
</accessibility_info>

<products>
    <territory>GB</territory>
</products>

正規表現を変更して改行も削除するにはどうすればよいので、次のようになります。

<accessibility_info>
    <accessibility role="captions" available="true" />
</accessibility_info>
<products>
    <territory>GB</territory>
</products>'
4

2 に答える 2

2

これを試して

print re.sub('<crew_member([^\>]*)>.*</crew_member>\n', '', xml, flags=re.DOTALL)

于 2013-01-11T22:36:09.077 に答える