10

を使用して、すべての HTML タグとそのコンテンツを削除する方法を知りたいですBeautifulSoup

入力:

... text <strong>ha</strong> ... text

出力:

... text ... text
4

2 に答える 2

20

使用replace_with()(またはreplaceWith()):

from bs4 import BeautifulSoup, Tag


text = "text <strong>ha</strong> ... text"

soup = BeautifulSoup(text)

for tag in soup.find_all('strong'):
    tag.replaceWith('')

print soup.get_text() 

プリント:

text  ... text

または、@mata が提案したように、tag.decompose()代わりにtag.replaceWith('')- を使用できますが、同じ結果が得られますが、より適切に見えます。

于 2013-08-26T21:30:46.267 に答える