2

これは私が持っているスクリプトです:

import BeautifulSoup

if __name__ == "__main__":
    data = """
    <root>
        <obj id="3"/>
        <obj id="5"/>
        <obj id="3"/>
    </root>
    """
    soup = BeautifulSoup.BeautifulStoneSoup(data)
    print soup

実行すると、次のように出力されます。

<root>
  <obj id="3"></obj>
  <obj id="5"></obj>
  <obj id="3"></obj>
</root>

同じ構造を維持したいのですが。どうやってやるの?

4

1 に答える 1

7

Beautiful Soupのドキュメントから:

の最も一般的な欠点BeautifulStoneSoupは、自己終了タグについて知らないことです。HTMLには固定された自己終了タグのセットがありますが、XMLではDTDの内容によって異なります。コンストラクターへの引数BeautifulStoneSoupとして名前を渡すことにより、特定のタグが自己終了していることがわかりますselfClosingTags

于 2009-10-14T16:22:13.967 に答える