1

Python を初めて使用するので、div 内の見出しから Python 2.7.x と Beautiful Soup を使用して文字列を検索するのに約 1 時間費やします。

import urllib2
from bs4 import BeautifulSoup

request = urllib2.Request("http://somerandomurl.org")
response = urllib2.urlopen(request)
soup = BeautifulSoup(response)

HTML ファイルは次のようになります。

<div class="ABC">
    <h1>My string</h1>
</div>

ここで試したBeautiful Soup Documentationのすべての方法( print soup.div('ABC').h1… を含む) を説明することはできませんが、読んでいるときに何かひどい間違いを犯したと思います。ご協力ありがとう御座います。

4

1 に答える 1

3

あなたが欲しかった:

soup.find('div', class_='ABC').h1

クラスを持つ最初の divタグを見つけ、そのABC中の最初の H1 タグにトラバースします。

>>> from bs4 import BeautifulSoup
>>> soup = BeautifulSoup('''
... <div class="ABC">
...     <h1>My string</h1>
... </div>
... ''')
>>> soup.find('div', class_='ABC').h1
<h1>My string</h1>
于 2013-03-12T22:09:25.733 に答える