0

Webサイトで変更を通知するスクリプトを作成しました。私はwgetを使用してサイトのhtmlをダウンロードし、それを過去にダウンロードしたものと比較します。<!--cached-->問題は、サイトがの後に追加されていることを数回チェックすること</html>です。--no-cacheをwgetに追加しようとしましたが、これは違いがありません。

なぜ<!--cached-->wget出力にランダムに追加されるのですか?これを防ぐためにできることですか、それともサイトのチェック方法を再考する必要がありますか?

4

2 に答える 2

1

Oracleは、ページの再生成を回避するためにキャッシュから提供できる動的ページを示すために、それに類似したタグを追加します。内容が前回の読み取りから変更されていないことを示している可能性があります。あなたはそれを除外することができます。

于 2013-01-06T02:07:20.430 に答える
0

これは--mirror、再帰的取得でオプションを使用する場合に発生する可能性があります。ドキュメントから:

ミラーリングに適したオプションをオンにします。このオプションは、再帰とタイムスタンプをオンにし、無限の再帰深度を設定し、FTPディレクトリリストを保持します。現在、「-r -N -linf--no-remove-listing」と同等です。

このようなタイムスタンプの例では、htmlファイルでdivタグを開くたびに続く最初のエントリに、コメント「!-cached -DDD、DD MMM YYY HH:MM:SS+4digitoffset->」がスタンプされます。

于 2020-02-09T06:13:06.260 に答える