Ruby のパーサーで nytimes の rss フィードを解析しようとしています。
nyt_url = 'http://www.nytimes.com/services/xml/rss/nyt/World.xml'
open(nyt_url) do |rss|
@nyt_feed = RSS::Parser.parse(rss)
end
そしてビューファイルで:
<h2>New York Times Feed</h2>
<% @nyt_feed.items.each do |item| %>
<p>
<%= link_to item.title, item.link %>
<%= item.description %>
</p>
<% end %>
しかし、説明のために私が得たものは次のようになります。
Since air assaults by the Assad government picked up two weeks ago,
knocking rebels in the south on their heels, Syrians have been arriving
at refuge camps in Jordan at a rate of about 2,000 a night.<img width='1' height='1'
src='http://rss.nytimes.com/c/34625/f/642565/s/22f90a36/mf.gif' border='0'/><br/><br/><a
href="http://da.feedsportal.com/r/139263791500/u/0/f/642565/c/34625/s/22f90a36/a2.htm"><img
src="http://da.feedsportal.com/r/139263791500/u/0/f/642565/c/34625/s/22f90a36/a2.img"
border="0"/></a><img width="1" height="1"
src="http://pi.feedsportal.com/r/139263791500/u/0/f/642565/c/34625/s/22f90a36/a2t.img"
border="0"/>
ワシントン・ポストのフィードでも同様の状況があります。画像を実際に表示するには、または少なくとも説明部分だけを取得するにはどうすればよいですか。これを正規表現で処理する必要がありますか、それともパーサー オブジェクトに使用すべきメソッドがありますか?