1

ヘッドタグにあるテキストを削除するコードがあります。ウェブサイトの html を提供してください

    for link in soup.findAll('head'):
        link.replaceWith("")

コンテンツ全体を "" に置き換えようとしています。ただし、これは機能していません。head タグ間のすべてのテキストをスープから完全に削除するにはどうすればよいですか。

4

2 に答える 2

0

""" (3 つの引用符) を使用する必要がありますが、2 つしか使用していないように見えます。

例:

"""
This block
is commented out
"""

ハッピーコーディング!

編集: これはユーザーが求めていたものではありません。申し訳ありません。

私は Beautiful Soup の経験はありませんが、SO であなたに役立つかもしれないコードのスニペットを見つけました ( source ):

soup = BeautifulSoup(source.lower())
to_extract = soup.findAll('ahref') #Edit the stuff inside '' to change which tag you want items to be removed from, like 'ahref' or 'head'
for item in to_extract:
    item.extract()

ただし、一見すると、ページ上のすべてのリンクが削除されるだけかもしれません。

これ以上役に立たなかったらごめんなさい!

于 2013-10-24T17:08:59.050 に答える