を使用して、すべての HTML タグとそのコンテンツを削除する方法を知りたいですBeautifulSoup
。
入力:
... text <strong>ha</strong> ... text
出力:
... text ... text
を使用して、すべての HTML タグとそのコンテンツを削除する方法を知りたいですBeautifulSoup
。
入力:
... text <strong>ha</strong> ... text
出力:
... text ... text
使用replace_with()
(またはreplaceWith()
):
from bs4 import BeautifulSoup, Tag
text = "text <strong>ha</strong> ... text"
soup = BeautifulSoup(text)
for tag in soup.find_all('strong'):
tag.replaceWith('')
print soup.get_text()
プリント:
text ... text
または、@mata が提案したように、tag.decompose()
代わりにtag.replaceWith('')
- を使用できますが、同じ結果が得られますが、より適切に見えます。