0

ねえ、私は例えば次のタグを含むhtmlページを持っています:

<p foruri="http://doc.scrapy.org/getting-help:solving-specific-problems" rec="lang.en" id="solving-specific-problems">Hello world!!! From my authoring tool.</p>

<p foruri="http://doc.scrapy.org/getting-help:getting help" rec="lang.en" id="getting help">Hello world!!! From my authoring tool.</p>

ここで、Pythonのscrapyフレームワークを使用してクローラーを作成しました。このフレームワークでは、cxxpathクエリを使用してforuriタグを検索しました。これ//@foruriにより、foruriタグが存在する場合は常にタグが提供されますが、問題はhttpを生成しないことです。

それで私がそれを手に入れるのを手伝ってください?

4

1 に答える 1

0

すべての<p>タグのforuri属性を抽出したいとします。

hxs.select('//p/@foruri').extract()
于 2011-03-30T16:39:37.537 に答える