3

次のような内容のスープがあります

多くのdiv、私が興味を持っているのは、クラス「foo」を持つものです

各 div には、多くのリンクやその他のコンテンツがあります。2 番目のリンク (2 番目<a> </a>) に興味があります => リンク (href 属性内) と 2 番目のリンク タグの間のテキストを取得したいのは常に 2 番目です。<a> </a>

例えば ​​:

<div class ="foo">
     <a href ="http://example.com"> </a>
     <a href ="http://example2.com"> Title here </a>
</div>

<div class ="foo">
     <a href ="http://example3.com"> </a>
     <a href ="http://example4.com"> Title 2 here </a>
</div>

ここで私は取得したい:

ここにタイトル => http://example2.com

ここにタイトル 2 => http://example4.com

私はいくつかのコードを書いてみました:

soup.findAll("div", { "class" : "foo" })

しかし、それはすべてのdivとそのコンテンツを含むリストを返し、さらに先に進む方法がわかりません

ありがとう :)

4

1 に答える 1