-4

私は次のHTMLを持っています:

<tr style='background:#DDDDDD;'>
    <td><b>ASD</b></td>
    <td colspan='3'>1231</td>
</tr>

この要素はページ上で繰り返されていないため、一意です。セルの内容(1231)を変数に入れたい。HTML.parserを使用してみましたが、機能しません

4

2 に答える 2

0

美しいスープを使ってみてください、それは素晴らしいです、

from BeautifulSoup import BeautifulSoup

soup = BeautifulSoup(html) ## feed your html page to beautifulsoup

pleaseFind = soup.find(text="ASD")

whatINeed = pleaseFind.findNext('td')

print whatINeed.text
于 2013-03-19T20:12:21.777 に答える
0

urllib2を使用できます(新しいものをインストールする必要はありません(少なくともWindowsバージョンのPythonの場合)):http ://docs.python.org/2/howto/urllib2.html

例:

import urllib2
response = urllib2.urlopen('your URL')
html = response.read()
#html is a string containing everything on your page

#this line (it could be a bit cleaner) finds substring "<td colspan='3'>" and
#searches between it's position and the next "</td>"
pos=html.find("<td colspan='3'>")
print html[pos+len("<td colspan='3'>")+1:html.find("</td>", pos))]
于 2013-03-19T20:14:11.983 に答える