ウェブページは次のようなものです。
<h2>section1</h2>
<p>article</p>
<p>article</p>
<p>article</p>
<h2>section2</h2>
<p>article</p>
<p>article</p>
<p>article</p>
記事を含む各セクションを見つけるにはどうすればよいですか? つまり、h2 を見つけた後、次の兄弟を見つけます。
次のh2まで。
Web ページが次のようなものである場合: (これは通常の場合です)
<div>
<h2>section1</h2>
<p>article</p>
<p>article</p>
<p>article</p>
</div>
<div>
<h2>section2</h2>
<p>article</p>
<p>article</p>
<p>article</p>
</div>
次のようなコードを書くことができます:
for section in soup.findAll('div'):
...
for post in section.findAll('p')
しかし、同じ結果を得るには、最初の Web ページをどうすればよいでしょうか?