次の部分的なHTMLについて、「調査を実施しています...治療法を見つけてください!」というテキストを取得しようとしています。のこぎり経由で2つの<br>
タグの間。
<b>Multiple Sclerosis National Research Institute</b><br>
<!-- <b>CFC Code: 12135</b><br /> ***** This is edited by Anas -->
<a href="http://www.ms-research.org" target="_blank">http://www.ms-research.org</a><br>
(866)-676-7400<br>
Conducts research towards understanding, treating and halting the progression of multiple sclerosis and related diseases. Current research progress is promising. Please help us find cures!<br>
<a href="/ntn/charities/view.aspx?record_id=510">Click here for more info</a><br><br>
これまでのところ、私はこのコードname
でとを取得することができました:url
url = "https://www.neighbortonation.org/ntn/charities/home.aspx"
doc = Nokogiri::HTML(open(url))
doc.css("#site-pagecontent table table td").each do |item|
name = item.at_css("b").text unless item.at_css("b").blank?
url = item.at_css("a")[:href] unless item.at_css("a").blank?
end
<br>
しかし、特定のタグ間のテキストを取得しようとして立ち往生しました。Nokogiriで<br>タグ間を抽出して提案を試しましたか?しかし、それはうまくいかなかったようです。何か案は?xpath、search、またはregexを使用する必要がありますか?