2

スクレイピーでスパイダーを書こうとする私の試みでは、href の場合と同じように、要素内からデータを抽出しようとし<tr><td><a href = "www.somelink.com">hxs.select('//tr/td/a/@href').extract() います。

class と data 属性を持つ span 要素があります <span class="classname" data="{...data in here...}">

ただし、以下を試すと、scrapy でエラーが発生します。ここで、スパン要素クラス = クラス名であるスパン要素のデータ属性を選択しています。

hxs.select('//div/span[@class="classname"]/@data/').extract()

href 以外の属性からデータを取得することさえ可能ですか? ありがとう

4

1 に答える 1

1

後に末尾のスラッシュを削除すると機能します@dataか?

于 2012-09-24T08:31:34.840 に答える