ヘッドタグにあるテキストを削除するコードがあります。ウェブサイトの html を提供してください
for link in soup.findAll('head'):
link.replaceWith("")
コンテンツ全体を "" に置き換えようとしています。ただし、これは機能していません。head タグ間のすべてのテキストをスープから完全に削除するにはどうすればよいですか。
ヘッドタグにあるテキストを削除するコードがあります。ウェブサイトの html を提供してください
for link in soup.findAll('head'):
link.replaceWith("")
コンテンツ全体を "" に置き換えようとしています。ただし、これは機能していません。head タグ間のすべてのテキストをスープから完全に削除するにはどうすればよいですか。
""" (3 つの引用符) を使用する必要がありますが、2 つしか使用していないように見えます。
例:
"""
This block
is commented out
"""
ハッピーコーディング!
編集: これはユーザーが求めていたものではありません。申し訳ありません。
私は Beautiful Soup の経験はありませんが、SO であなたに役立つかもしれないコードのスニペットを見つけました ( source ):
soup = BeautifulSoup(source.lower())
to_extract = soup.findAll('ahref') #Edit the stuff inside '' to change which tag you want items to be removed from, like 'ahref' or 'head'
for item in to_extract:
item.extract()
ただし、一見すると、ページ上のすべてのリンクが削除されるだけかもしれません。
これ以上役に立たなかったらごめんなさい!