解析したい XML は次のようになります。
<root>
<group>
<somethingelse>
<group></group>
</somethingelse>
</group>
</root>
ご覧のとおり<group>
、別の の階層に があります<group>
。で解析するとBeautifulStoneSoup
、内側<group>
が外側になります(以下の例を参照)。
これを防ぎ、内部<group>
を定義された場所に保つにはどうすればよいですか?
コード
from BeautifulSoup import BeautifulStoneSoup
xml = """
<root>
<group>
<somethingelse>
<group></group>
</somethingelse>
</group>
</root>
"""
def main():
doc = BeautifulStoneSoup(xml)
print doc.prettify()
if __name__ == '__main__':
main()
結果
<root>
<group>
<somethingelse>
</somethingelse>
</group>
<group>
</group>
</root>