私はこのページからレビューを解析しようとしています:http://www.amazon.co.uk/product-reviews/B00143ZBHY
次のアプローチを使用します。
コード
html # a variable which contains exact html as given at the above page.
from lxml import etree
tree = etree.HTML(html)
r = tree.xpath(".//*[@id='productReviews']/tbody/tr/td[1]/div[9]/text()[4]")
print len(r)
print r[0].tag
出力
0
Traceback (most recent call last):
File "c.py", line 37, in <module>
print r[0].tag
IndexError: list index out of range
p、s ,: firefoxのxpathチェッカーアドオンで同じxpathを使用している間、私はそれを簡単に行うことができます。しかし、ここでは結果はありません、助けてください!