0

私は次のようなhtmlファイルを持っています:

<html>...  
  <li id="123"></li>
  <li id="3455"></li>
  ....
</html>

BeautifulSoupを使用してPythonですべてのIDの値を取得するにはどうすればよいですか?必要な出力は次のとおりです。["123","3455"]

4

2 に答える 2

2

必要なリストを取得するには、リスト内包表記を使用します。次のように1行で実行できます(最後の行):

html = '<html> <li id="123"></li><li id="3455"></li> </html>'
soup = BeautifulSoup(html)

attrs = [li['id'] for li in soup.find_all('li')]
于 2012-07-13T23:26:53.267 に答える
0
from BeautifulSoup import BeautifulSoup

foo = '<html> <li id="123"> </li> <li id="3455"></li> </html>'

soup = BeautifulSoup(foo)

for id in soup.html.findAll('li'):
    print id['id']
于 2012-07-13T23:21:43.977 に答える