1

私はこれに似たHTMLを持っています:

<div>
    <h4><a href="#">Don't Match Me</a></h4>
    <a href="#">Match Me</a>
    <a href="#">Match Me</a>
    <a href="#">Match Me</a>
</div>

aの中にないすべての要素を選択するにはどうすればよいh4ですか? 試してみa[not(ancestor::h4)]ましたが、正直なところ、自分が何をしているのかわかりません。

また、ちょっとした副次的な質問として、PyQuery または BeautifulSoup を実装する Scrapy セレクター クラスはありますか?

4

1 に答える 1

2

使用するべき Scrapy セレクターは次のとおりです。

hxs.select('//a[not(ancestor::h4)]/text()').extract()
于 2013-01-02T13:51:50.650 に答える