私はこのブロックをこすり取ろうとしています:
<b>Address:</b></br>
First Line</br>
Second Line</br>
City, State Zip</br>
<b>Phone: 718-555-2121</br>
<b>Fax:</b> 718-555-1212</br>
<b>Email:</b> ex@example.com</br>
確実に口述に。
dict = {
'address':'First Line\n Second Line\n City, State Zip\n',
'phone':'718-555-2121',
'Fax:':'718-555-1212',
'Email:':'ex@example.com',
}
太字で次にnext_siblingを探すと、電話番号、ファックス、電子メールは問題なく表示されますが、アドレスはほんの一握りの兄弟です。
for nut in soup.find_all("b"):
print nut,
try:
print nut.next_sibling.tag
except:
print nut.next_sibling
太字で次にnext_siblingsを探すと、すべての兄弟が表示されます。
for nut in soup.find_all("b"):
print nut
for s,sibling in enumerate(nut.next_siblings):
print s, (repr(sibling))
while
大胆な兄弟に到達するまでnext_siblingsを組み立て続けると言うクリーンな方法(?)はありますか?