次のような内容のスープがあります
多くのdiv、私が興味を持っているのは、クラス「foo」を持つものです
各 div には、多くのリンクやその他のコンテンツがあります。2 番目のリンク (2 番目<a> </a>
) に興味があります => リンク (href 属性内) と 2 番目のリンク タグの間のテキストを取得したいのは常に 2 番目です。<a> </a>
例えば :
<div class ="foo">
<a href ="http://example.com"> </a>
<a href ="http://example2.com"> Title here </a>
</div>
<div class ="foo">
<a href ="http://example3.com"> </a>
<a href ="http://example4.com"> Title 2 here </a>
</div>
ここで私は取得したい:
ここにタイトル => http://example2.com
ここにタイトル 2 => http://example4.com
私はいくつかのコードを書いてみました:
soup.findAll("div", { "class" : "foo" })
しかし、それはすべてのdivとそのコンテンツを含むリストを返し、さらに先に進む方法がわかりません
ありがとう :)