BeautifulSoup を使用して HTML のクリーニングを行っています。Python と BeautifulSoup の両方に精通しています。Stackoverflow の他の場所で見つけた回答に基づいて、次のようにタグが正しく削除されています。
[s.extract() for s in soup('script')]
しかし、インライン スタイルを削除するにはどうすればよいでしょうか。たとえば、次のようにします。
<p class="author" id="author_id" name="author_name" style="color:red;">Text</p>
<img class="some_image" href="somewhere.com">
次のようになる必要があります。
<p>Text</p>
<img href="somewhere.com">
すべての要素のインライン クラス、id、名前、およびスタイル属性を削除する方法は?
BeautifulSoup ではなく、CSS パーサーを使用してこれを処理することについて言及されている他の同様の質問への回答をすべて見つけることができましたが、タスクは属性を操作するのではなく単に削除することであり、すべてのタグの包括的なルールであるため、見つけたいと思っていましたBeautifulSoup 内ですべてを行う方法です。