1

以下を使用して Python で HTML タグを削除していますが、& (アンパサンド) も削除されており、そのままにしておく必要があります。何か案は?

from HTMLParser インポート HTMLParser

class MLStripper(HTMLParser):
    def __init__(self):
        self.reset()
        self.fed = []
    def handle_data(self, d):
        self.fed.append(d)
    def get_data(self):
        return ''.join(self.fed)

def strip_tags(html):
    s = MLStripper()
    s.feed(html)
    return s.get_data()


(また、コード ブロックが連携していません。最後の 3 行のインデントを想像してください)

4

1 に答える 1