1

大学のプロジェクト用に Google Reader のような Web ツールを作成する必要があります。

私はそれについて2つの質問があります:

1) Google リーダーは、既読および未読の投稿をどのように追跡しますか?

2) Google リーダーはすべての投稿をデータベースに保存するか、現時点でフィードをロードしますか?

4

4 に答える 4

3
  1. 単一のフィード投稿にハッシュを割り当てます (つまり、日付+url+??? = 単一の投稿を識別するためのハッシュ)
  2. それらをオンザフライでロードするのは私の推測ですが、おそらくユーザーごとに限られた数をキャッシュします。
于 2010-10-13T00:09:58.937 に答える
2

それが今役立つかどうかはわかりませんが、立ち寄った他の人のために、私は詳細なデザインで私の考えを書き留めました:

スケーラブルなGoogleリーダークローンの設計

于 2011-02-11T12:16:22.007 に答える
2

re #2: Google にはFeedFetcherと呼ばれる特別な RSS クローラー ボットがあります。RSS フィードを要求すると、RSS フィードがディスパッチされて取得され、URL で識別されるグローバル (全ユーザー) キャッシュにフィードが格納されます。次にフィードが要求されると (別のユーザーによっても - URL が一致する限り)、キャッシュから読み込まれます。

キャッシュ無効化メカニズムが何であるかはわかりませんが、応答のCache-Controlメカニズムが示すほど頻繁にクローラーがフィードを厳密に再訪問することは間違いありません (これはおそらく良いことです。多くの生成された RSS フィードno-cacheは変更されなくても送信するためです)。頻繁すぎる)。ただし、この内部キャッシュは数時間以上持続しないようです。

(これらは、RSS フィードのアクセス ログから少し前に立てた仮説です。それ以降、クローラーの動作に大きな変化は見られないので、今でも有効だと思います)

于 2010-10-13T13:06:42.327 に答える
0

新しい多目的 RSS リーダー、ライブ ストリーム、マッシュアップ、集約 Web アプリケーションであるSelfoosを使用します。

特徴:

  • Web ベースの RSS リーダー
  • ユニバーサル アグリゲータ
  • オープンソースで無料
  • オープンなプラグイン システムで簡単に拡張可能 (独自のデータ コネクタを記述)
  • モバイル サポート (Android、iOS、iPad)
  • セルフォスを使用して、すべての投稿、ツイート、フィードをライブ ストリーミングし、1 か所に収集します
  • 2 MB 未満の軽量 PHP アプリケーション
  • MySQL、PostgreSQL、Sqlite データベースをサポート
  • OPML インポート
  • 簡単なインストール: アップロードして実行
  • 安らかなjson APIを使用

ウェブサイト: http://selfoss.aditu.de/

GitHub : https://github.com/SSilence/selfoss

于 2013-11-19T08:09:50.500 に答える