3

私のアプリケーションは、RSS/Atom フィードを追跡し、新しいエントリをデータベースに保存する必要があります。私の質問は、フィード内のエントリが既にクロールされているかどうかを判断する最も信頼できる方法は何ですか?

Universal Feed Parserモジュールを使用してフィードを解析します。私の現在の実装では、エントリの値が記録された値より大きい場合、feed.entry[i].updated_parsedクロール時にの最新の値を記録し、そのエントリはデータベースに保存されます。updated_parsedここでの問題は、多くのフィードに発行日または更新日がないことです。

4

1 に答える 1

3

主にエントリを参照してエントリを既にクロールしたかどうかを判断し(がない場合は に<guid>フォールバックします)、日付に関することは二次分析としてのみ判断する必要があります。<link><guid>

于 2009-03-28T05:25:46.713 に答える