私がテキストを持っていた場合:
text = '<span id="foo"></span> <div id="bar"></div>'
変更可能なテキスト(IDがない可能性があります)を使用して、BeautifulSoupを使用してタグ名に関係なくID名を取得するにはどうすればよいですか(['foo'、'bar']を返します)。私はBeautifulSoupにそれほど経験がなく、このタスクを実行することに混乱しています。
私がテキストを持っていた場合:
text = '<span id="foo"></span> <div id="bar"></div>'
変更可能なテキスト(IDがない可能性があります)を使用して、BeautifulSoupを使用してタグ名に関係なくID名を取得するにはどうすればよいですか(['foo'、'bar']を返します)。私はBeautifulSoupにそれほど経験がなく、このタスクを実行することに混乱しています。
id属性を持つタグを取得してから、id属性の値を文字列に返す必要があります。
from BeautifulSoup import BeautifulSoup
text = '<span id="foo"></span> <div id="bar"></div>'
pool = BeautifulSoup(text)
result = []
for tag in pool.findAll(True,{'id':True}) :
result.append(tag['id'])
と結果
>>> result
[u'foo', u'bar']