0

次のような HTML タグがあります。

<ul class="clearfix">
  "<li><span class="bold-title">Starts:</span> October 2013</li>"
</ul>

「2013年10月」を抽出したい。
私のコードは次のとおりです。

start_date = articl.find('ul', class_='clearfix').find('li').text.strip()

...「開始: 2013 年 10 月」を抽出します。

日付だけを取るにはどうすればよいですか?

4

3 に答える 3

0
hold = li.text
for eachTag in li.findAll():
    hold = hold.replace(eachTag.text,'')
于 2013-05-28T17:43:20.487 に答える
0

.contentsリストを返すを使用します。

>>> from bs4 import BeautifulSoup as BS
>>> html = (stuff above)
>>> soup = BS(html)
>>> print soup.find('li').contents[1].strip()
October 2013
于 2013-05-25T08:26:02.020 に答える