0

XpathまたはCSSのいずれかを使用できます。

私は試した:

my_page.xpath('//h4/p')

pしかし、それはの子であるタグだけを探しているようですh4

私が解析しているHTML構造は次のようになります。

<h4 class="ban">Mon May 28</h4>
<p><a href="http://phoenix.craigslist.org/cph/cpg/3043067349.html">.Net/Java Developers</a> - <font size="-1"> (phoenix )</font></p>
<p><a href="http://phoenix.craigslist.org/cph/cpg/3043066699.html">QA and Business Analysts</a> - <font size="-1"> (Phoenix Metro)</font></p>

ページには他にも要素がありpますa...しかし、基本的に私がやりたいのは、タグ内の単語h4を、ページ上でタグの後に続くリンクに関連付けることです(タグ内にネストされていません)。

ありがとう。

4

1 に答える 1

1

my_page.css("h4 + p")動作するはずです。

+隣接兄弟セレクタです。

于 2012-05-28T20:25:52.533 に答える