次のページの場合:
http://www.aidn.org.au/Industry-ViewCompany.asp?CID=3113
次のスクレイプコードがあります。
findit = soup.find_all("td", "Page-Headers", align="left")
print findit
以下を返します。
[<td align="left" class="Page-Headers" valign="middle">Aerospace Materials Pty Ltd</td>]
これまでのところ良い。
BeautifulSoupを使用して、このパターンからテキスト要素(「Aerospace Materials Pty Ltd」)を返すにはどうすればよいですか? または、この出力を単純に正規表現する最良の方法はありますか?
ありがとう!