大学のプロジェクト用に Google Reader のような Web ツールを作成する必要があります。
私はそれについて2つの質問があります:
1) Google リーダーは、既読および未読の投稿をどのように追跡しますか?
2) Google リーダーはすべての投稿をデータベースに保存するか、現時点でフィードをロードしますか?
大学のプロジェクト用に Google Reader のような Web ツールを作成する必要があります。
私はそれについて2つの質問があります:
1) Google リーダーは、既読および未読の投稿をどのように追跡しますか?
2) Google リーダーはすべての投稿をデータベースに保存するか、現時点でフィードをロードしますか?
それが今役立つかどうかはわかりませんが、立ち寄った他の人のために、私は詳細なデザインで私の考えを書き留めました:
re #2: Google にはFeedFetcherと呼ばれる特別な RSS クローラー ボットがあります。RSS フィードを要求すると、RSS フィードがディスパッチされて取得され、URL で識別されるグローバル (全ユーザー) キャッシュにフィードが格納されます。次にフィードが要求されると (別のユーザーによっても - URL が一致する限り)、キャッシュから読み込まれます。
キャッシュ無効化メカニズムが何であるかはわかりませんが、応答のCache-Controlメカニズムが示すほど頻繁にクローラーがフィードを厳密に再訪問することは間違いありません (これはおそらく良いことです。多くの生成された RSS フィードno-cacheは変更されなくても送信するためです)。頻繁すぎる)。ただし、この内部キャッシュは数時間以上持続しないようです。
(これらは、RSS フィードのアクセス ログから少し前に立てた仮説です。それ以降、クローラーの動作に大きな変化は見られないので、今でも有効だと思います)
新しい多目的 RSS リーダー、ライブ ストリーム、マッシュアップ、集約 Web アプリケーションであるSelfoosを使用します。
特徴:
ウェブサイト: http://selfoss.aditu.de/
GitHub : https://github.com/SSilence/selfoss