2

私はウェブスクレイパーを作成していましたが、データの分析には必要ないため、いくつかの div を完全に削除したいと考えていました。Beautiful Soup を使用してデータを解析していますが、div を完全に削除する方法がわかりません

4

1 に答える 1

1

次のようなものを使用できます。

>>> import bs4
>>> blah = '<div id="test"><p>one</p></div><div id="okay"><p>something</p></div>'
>>> soup = bs4.BeautifulSoup(blah)
>>> soup('div', {'id': 'test'})[0].extract()
<div id="test"><p>one</p></div>
>>> soup
<html><body><div id="okay"><p>something</p></div></body></html>
于 2012-11-30T20:20:35.153 に答える