2

一部の HTML コードには、dt次のようなタグが含まれています。

<dt>PLZ:</dt>
<dd>
8047
</dd>

ddtext のタグに続くタグdt内のテキストを検索したいPLZ:。ドキュメントによると、私は次のことを試みています:

number = BeautifulSoup(text).find("dt",text="PLZ:").findNextSiblings("dd")

上記の文字列を使用textしますが、探している番号ではなく空のリストしか取得できません(もちろん文字列として)。多分私はドキュメントを誤解していますか?

4

2 に答える 2

2

だから試してみてください:

from BeautifulSoup import BeautifulSoup

text = """
<dt>PLZ:</dt>
<dd>
8047
</dd>"""

number = BeautifulSoup(text).find("dt",text="PLZ:").parent.findNextSiblings("dd")
print BeautifulSoup(''.join(number[0]))

または、findNext で見つかった場合は、次を試してください。

number = BeautifulSoup(text).find("dt",text="PLZ:").parent.findNext("dd").contents[0]
于 2012-10-27T19:20:47.137 に答える
0

これは私のために働いた:

from BeautifulSoup import BeautifulSoup

text = '''<dt>PLZ:</dt>
<dd>
8047
</dd>'''


BeautifulSoup(text).find("dt",text="PLZ:").parent.findNextSiblings('dd')
于 2012-10-27T19:21:10.120 に答える