ソースは次のとおりです。
<span class="new"> <a class="blog" href="http://whatever1.com" rel="nofollow">whatever1</a> do something at <a class="others" href="http://example1.com" rel="nofollow">example1</a></span>
<span class="new"> <a class="blog" href="http://whatever2.com" rel="nofollow">whatever2</a> do other things at <a class="others" href="http://example2.com" rel="nofollow">example2</a></span>
<span class="new"> <a class="blog" href="http://whatever3.com" rel="nofollow">whatever3</a> do something at <a class="others" href="http://example3.com" rel="nofollow">example3</a></span>
<span class="new">
その中のすべてを見つけたいのですがdo something at
、これが私のコードです。なぜ機能しないのかわかりません:
soup = bs4.BeautifulSoup(html, "lxml")
all_tags = soup.findAll(name = "span", attrs = {"class": "new"}, text = re.compile('do something.*'))
何も見つかりません。上記のタグをすべて削除するtext = re.compile('.*do something.*')
と、正規表現パターンに何か問題があることがわかります。正しい形式は何ですか?