1

使ってますscrapy 0.14

以下は私のコードです

start_urls = ['http://lakebagger.com/ur/']

def parse(self, response):
    hxs = HtmlXPathSelector(response)
    stores=hxs.select('//table[@id]//tr')
    print len(stores)

tbodyの行(tr)にアクセスできません。代わりに、 ad行にしかアクセスできません。行にアクセスするにはどうすればよいですか?

前もって感謝します 。HtmlXpathSelectorがxpathを正確にランダーできないようです

4

1 に答える 1

2

この時点で、Windows 7で同様のスクリプトを動作させることができたので、OSの問題ではありませんが、環境に問題があると言えます。「pipfreeze」と入力した結果はどうなりますか。

私の:

Scrapy==0.16.2
Twisted==12.2.0
distribute==0.6.32
egenix-pyopenssl==0.13.0-1.0.0g-1
lxml==3.0.1
pyOpenSSL==0.9
pywin32==216
w3lib==1.2
zope.interface==3.8.0

また、不足している行に問題の原因となっている可能性があるため、調査のために完全なスパイダーコードを投稿する必要があると思います。

編集:あなたのコメントに基づいて、これはあなたが0.14を実行しているのでバージョンに関連している可能性があります。アップグレードを検討しましたか?

注:scrapyをインストールするには、次の手順に従いました。

于 2012-12-10T08:30:36.163 に答える