python - Beautiful Soup で HTML タグ内の特定のテキストを抽出する方法は?

Question

次のような HTML タグがあります。

<ul class="clearfix">
  "<li><span class="bold-title">Starts:</span> October 2013</li>"
</ul>

「2013年10月」を抽出したい。
私のコードは次のとおりです。

start_date = articl.find('ul', class_='clearfix').find('li').text.strip()

...「開始: 2013 年 10 月」を抽出します。

日付だけを取るにはどうすればよいですか？

score 0 · Accepted Answer

0

hold = li.text
for eachTag in li.findAll():
    hold = hold.replace(eachTag.text,'')

于 2013-05-28T17:43:20.487 に答える

score 0 · Accepted Answer

.contentsリストを返すを使用します。

>>> from bs4 import BeautifulSoup as BS
>>> html = (stuff above)
>>> soup = BS(html)
>>> print soup.find('li').contents[1].strip()
October 2013

3 に答える 3