1

まず第一に、これはプログラミング関連の質問ではなく、ここに投稿して本当に申し訳ありませんが、本当にそれについて知る必要があります. 私はRSSリーダーアプリを構築していますが、注目の画像に関する情報がRSS xmlのどこにあるかを知りたかっただけです。以下は、CNN rss から取得した xml ファイルからの抜粋ですが、画像に関する情報はどこにありますか。

<item><title>Ice melt speeding up, study finds</title><guid>http://edition.cnn.com/2012/11/29/world/europe/climate-ice-sheets/index.html</guid><link>http://edition.cnn.com/2012/11/29/world/europe/climate-ice-sheets/index.html?eref=edition</link><description>Two decades of satellite readings back up what dramatic pictures have suggested in recent years: The mile-thick ice sheets that cover Greenland and most of Antarctica are melting at a faster rate in a warming world.</description><pubDate>Thu, 27 Jun 2013 08:59:27 EDT</pubDate></item>
<item><title>Twins 'stolen' from hospital rescued</title><guid>http://edition.cnn.com/2013/08/10/world/asia/china-baby-trafficking-twin-girls/index.html</guid><link>http://edition.cnn.com/2013/08/10/world/asia/china-baby-trafficking-twin-girls/index.html?eref=edition</link><description>Police in China have rescued twin baby girls allegedly sold by a maternity doctor, bringing the number of infants recovered from the suspected trafficking ring to three, state media reported. </description><pubDate>Sun, 11 Aug 2013 19:31:43 EDT</pubDate></item>
<item><title>HK makes $5M ivory bust</title><guid>http://edition.cnn.com/2013/08/08/world/hong-kong-ivory-tusk-seizure-august/index.html</guid><link>http://edition.cnn.com/2013/08/08/world/hong-kong-ivory-tusk-seizure-august/index.html?eref=edition</link><description>In one of the biggest busts of its kind in Hong Kong, customs authorities this week seized more than 1,100 ivory tusks, 13 rhino horns and five leopard pelts. The haul, found in a container shipped from Nigeria, is valued at more than $5.3 million.</description><pubDate>Sun, 11 Aug 2013 19:31:58 EDT</pubDate></item>
<item><title>Human transmission of H7N9</title><guid>http://edition.cnn.com/2013/08/07/health/china-bird-flu-transmission/index.html</guid><link>http://edition.cnn.com/2013/08/07/health/china-bird-flu-transmission/index.html?eref=edition</link><description>Until this week, no cases of human-to-human transmission of the deadly bird flu virus that broke out in China this year had been reported.</description><pubDate>Wed, 07 Aug 2013 22:16:18 EDT</pubDate></item>
<item><title>Doctor accused of taking newborns</title><guid>http://edition.cnn.com/2013/08/07/world/asia/china-baby-trafficking-shaanxi/index.html</guid><link>http://edition.cnn.com/2013/08/07/world/asia/china-baby-trafficking-shaanxi/index.html?eref=edition</link><description>Chinese health authorities have promised an overhaul in hospitals across the country following the arrest of an obstetrician for allegedly selling newborns to human traffickers, state media reports.</description><pubDate>Wed, 07 Aug 2013 03:38:22 EDT</pubDate></item>
<item><title>Chinese tourists targeted in Paris</title><guid>http://edition.cnn.com/2013/08/07/travel/chinese-tourists-paris-pickpockets/index.html</guid><link>http://edition.cnn.com/2013/08/07/travel/chinese-tourists-paris-pickpockets/index.html?eref=edition</link><description>It's known as the City of Light, but it risks becoming known as the city of the light-fingered.</description><pubDate>Wed, 07 Aug 2013 22:16:33 EDT</pubDate></item>

フィード リンクをたどり、目的のページから画像やテキストをスクラップする Web クローラーを作成する必要がありますか? プロの RSS リーダーがどのように機能するかを知りたいだけです。

参考までに、私はこれについて多くのことをグーグルで調べましたが、うまくいかなかったので、人々に尋ねています.助けてください.

4

1 に答える 1

1

画像に関する情報は xml に保存されないため、何らかの方法でクロールする必要があります。

フィード リンクをたどり、目的のページから画像やテキストをスクラップする Web クローラーを作成する必要がありますか?

はい。リンクした cnn ストーリーの場合、タイトル画像は常に div クラス"cnn_stryimg640captioned"内にあります。

ビデオと画像ギャラリー (ヘッダーとして) を別々に処理する必要があります。

プロの RSS リーダーがどのように機能するかを知りたいだけです。

プロの rss リーダーは、どの画像が記事に関連するかを判断するのに役立ついくつかの凝ったアルゴリズムを持っています。彼らはいつもそれを正しく理解しているとは限りません。

于 2013-08-12T15:43:14.757 に答える