1

Webページの変更を確認する最も簡単な方法は何でしょうか。Webページを頻繁にスキャンして、古いスキャンと比較したいと思います。1つの問題は、時刻などの特定の変更を無視するためのスキャンも必要なことです。関連する更新のみを確認したいのです。

4

1 に答える 1

4

コードは書きませんが、この問題を解決するためのプロセスを紹介します。

  1. ページのソースを取得する
  2. 監視する必要のないページのすべての部分を置き換えます
  3. 置換が行われた後、ソースの md5 または sha1 ハッシュを計算します
  4. ハッシュを保存されたハッシュと比較し、それが異なるかどうかを確認し、ページが更新された場合に必要なことを行います
  5. 新しいハッシュを保存する
于 2012-06-25T02:29:37.937 に答える