私のアプリケーションは、RSS/Atom フィードを追跡し、新しいエントリをデータベースに保存する必要があります。私の質問は、フィード内のエントリが既にクロールされているかどうかを判断する最も信頼できる方法は何ですか?
Universal Feed Parserモジュールを使用してフィードを解析します。私の現在の実装では、エントリの値が記録された値より大きい場合、feed.entry[i].updated_parsed
クロール時にの最新の値を記録し、そのエントリはデータベースに保存されます。updated_parsed
ここでの問題は、多くのフィードに発行日または更新日がないことです。