from bs4 import BeautifulSoup
xmlcontent = "some text with <tags>"
bs = BeautifulSoup(xmlcontent, "xml")
print bs
出力:
<?xml version="1.0" encoding="utf-8"?>
some text with <tags>
出力しないことは可能ですか:
<?xml version="1.0" encoding="utf-8"?>
を使用して、追加されたタグをlxml
削除できるかどうかはわかっています。<body>
bs = BeautifulSoup(xmlcontent, "lxml")
print bs.body.next
xml
xml バージョンとエンコーディングが含まれないように使用する同等のものはありますか?
解析されるコンテンツはほとんどの場合 xml 形式であるため、使用することを選択していました。これが最良の選択ですか、それとも xml コンテンツに使用できxml
ますか?lxml
lxml