python - 行を取得できません

Question

使ってますscrapy 0.14

以下は私のコードです

start_urls = ['http://lakebagger.com/ur/']

def parse(self, response):
    hxs = HtmlXPathSelector(response)
    stores=hxs.select('//table[@id]//tr')
    print len(stores)

tbodyの行（tr）にアクセスできません。代わりに、 ad行にしかアクセスできません。行にアクセスするにはどうすればよいですか？

前もって感謝します。HtmlXpathSelectorがxpathを正確にランダーできないようです

score 2 · Accepted Answer

この時点で、Windows 7で同様のスクリプトを動作させることができたので、OSの問題ではありませんが、環境に問題があると言えます。「pipfreeze」と入力した結果はどうなりますか。

私の：

Scrapy==0.16.2
Twisted==12.2.0
distribute==0.6.32
egenix-pyopenssl==0.13.0-1.0.0g-1
lxml==3.0.1
pyOpenSSL==0.9
pywin32==216
w3lib==1.2
zope.interface==3.8.0

また、不足している行に問題の原因となっている可能性があるため、調査のために完全なスパイダーコードを投稿する必要があると思います。

編集：あなたのコメントに基づいて、これはあなたが0.14を実行しているのでバージョンに関連している可能性があります。アップグレードを検討しましたか？

注：scrapyをインストールするには、次の手順に従いました。

python - 行を取得できません

1 に答える 1

Related

Reference