5

私がテキストを持っていた場合:

text = '<span id="foo"></span> <div id="bar"></div>'

変更可能なテキスト(IDがない可能性があります)を使用して、BeautifulSoupを使用してタグ名に関係なくID名を取得するにはどうすればよいですか(['foo'、'bar']を返します)。私はBeautifulSoupにそれほど経験がなく、このタスクを実行することに混乱しています。

4

1 に答える 1

10

id属性を持つタグを取得してから、id属性の値を文字列に返す必要があります。

from BeautifulSoup import BeautifulSoup
text = '<span id="foo"></span> <div id="bar"></div>'
pool = BeautifulSoup(text)
result = []
for tag in pool.findAll(True,{'id':True}) :
    result.append(tag['id'])

と結果

>>> result
[u'foo', u'bar']
于 2012-11-18T04:16:40.760 に答える