0

以下からの出力:

import feedparser
d = feedparser.parse('http://www.netflix.com/NewWatchInstantlyRSS')
d.entries[177].keys()

は:

['summary_detail', 'links', 'title', 'summary', 'guidislink', 'title_detail', 'link', 'id']

http://feedparser.org/docs/common-rss-elements.htmlによると、エントリには「date」要素が含まれている必要があります。

手がかりは、 FirefoxまたはSafari(Mac OS Xの場合)でhttp://www.netflix.com/NewWatchInstantlyRSSを開いたときに、日付が表示されないことです。(実際、Safariは、フィードを開いた日時を各要素の横に配置します。)しかし、どういうわけか、Googleリーダーは各要素に固有の日付を取得します。(これが、上記のエントリ177を選択した理由です。これが「Dare」のインデックスです。これは、Googleリーダーによると、その横に「午前8時32分」と表示されている今日の最初のエントリです。)

RSSについてわからないことがありますか?日付との相互参照フィードのようなものがありませんか?フィード内のすべてのエントリといくつかのエントリを調べましたが、別のURLまたは任意の種類の日付を指している可能性のあるものは何も表示されません。

4

1 に答える 1

1

http://www.netflix.com/NewWatchInstantlyRSS(Webブラウザーで開いてソースを表示)でRSSフィードの生のソースを見ると、日付要素が含まれていないことがわかります。あるべきですが、ありません。

編集:申し訳ありませんが、私はあなたの質問を完全に読んでいませんでした。Googleがその日付の価値をどこで得ているのかわかりません。私もグーグルにフィードを入れて、今日の午前10時32分にDareを受け取ります。これは、どのタイムゾーンでもあなたと同じではありません。更新されたフィードをいつ取得したかについては、独自のキャッシュを使用します。おそらく、サーバーが異なるため、違いがわかります。

RSSフィードには、単に存在しない場合にこの値を取得するための特別なプロパティはありません。必要な場合。Googleが使用していると私が信じているのと同様の方法を使用することをお勧めします。

于 2010-03-05T01:54:33.967 に答える