最初の質問へのリンクは次の場所にあります。
編集しましたが、新しい質問として再送信するように言われました。ただし、上記のリンクを使用すると、一般的なアイデアを得ることができます。以下編集を引き継ぐ。ありがとうございました!
この質問に新しいひねりを加えて申し訳ありません。自分たちが何を望んでいるのかを考える時間が増えました。だから... Webページの変更を検出するのは、時間に依存するページの要素が頻繁に変更されるため、ばかげています。代わりに、ページ内のドキュメントを検出できるようにしたいと考えています。たとえば、そのページで変更される Excel、Word ドキュメント、または PDF がある場合。したがって、これらのドキュメントに対してハッシュを実行し、何らかのスケジュールで、新しいドキュメントが追加されたかどうか、または古いドキュメントが変更されたかどうかを確認します。ページに埋め込まれたドキュメントを検出してハッシュを実行する方法について何か提案はありますか? 再度、感謝します!