from bs4 import BeautifulSoup
xmlcontent = "some text with <tags>"
bs = BeautifulSoup(xmlcontent, "xml")
print bs
出力:
<?xml version="1.0" encoding="utf-8"?>
some text with <tags>
出力しないことは可能ですか:
<?xml version="1.0" encoding="utf-8"?>
を使用して、追加されたタグをlxml削除できるかどうかはわかっています。<body>
bs = BeautifulSoup(xmlcontent, "lxml")
print bs.body.next
xmlxml バージョンとエンコーディングが含まれないように使用する同等のものはありますか?
解析されるコンテンツはほとんどの場合 xml 形式であるため、使用することを選択していました。これが最良の選択ですか、それとも xml コンテンツに使用できxmlますか?lxmllxml