次のような形式の HTML ページがあります。
<section class="entry-content">
<p>...</p>
<p>...</p>
<p>...</p>
</section>
<p>
BeautifulSoup/Python を使用して、タグに含まれるテキストを取得しようとしています。<p>
これは私がこれまでに持っているものですが、タグを「掘り下げて」テキストを取得する方法がわかりません。どんな提案でも大歓迎です。
import urllib2
from BeautifulSoup import BeautifulSoup
def main():
url = 'URL'
data = urllib2.urlopen(url).read()
bs = BeautifulSoup(data)
ingreds = bs.find('section', {'class': 'entry-content'})
fname = 'most.txt'
with open(fname, 'w') as outf:
outf.write('\n'.join(ingreds))
if __name__=="__main__":
main()