私は次のようなhtmlファイルを持っています:
<html>...
<li id="123"></li>
<li id="3455"></li>
....
</html>
BeautifulSoupを使用してPythonですべてのIDの値を取得するにはどうすればよいですか?必要な出力は次のとおりです。["123","3455"]
私は次のようなhtmlファイルを持っています:
<html>...
<li id="123"></li>
<li id="3455"></li>
....
</html>
BeautifulSoupを使用してPythonですべてのIDの値を取得するにはどうすればよいですか?必要な出力は次のとおりです。["123","3455"]
必要なリストを取得するには、リスト内包表記を使用します。次のように1行で実行できます(最後の行):
html = '<html> <li id="123"></li><li id="3455"></li> </html>'
soup = BeautifulSoup(html)
attrs = [li['id'] for li in soup.find_all('li')]
from BeautifulSoup import BeautifulSoup
foo = '<html> <li id="123"> </li> <li id="3455"></li> </html>'
soup = BeautifulSoup(foo)
for id in soup.html.findAll('li'):
print id['id']