python - div の内容を抽出しますか?

Question

bs4 で div の内容を抽出する方法:

>>> Doc
<div class="document">
<p>Text.</p>
<p>More text</p>
</div>

>>> type(Doc)
bs4.element.Tag

そして手に入れたい

<p>Text.</p>
<p>More text</p>

score 1 · Accepted Answer

使用.contents:

>>> Doc = soup.find('div', {'class': 'document'}) # assuming soup is your main content
>>> for i in [x for x in Doc.contents if x != '\n']:
...     print i
... 
<p>Text.</p>
<p>More text</p>

python - div の内容を抽出しますか?

2 に答える 2

Related

Reference