0

同じ名前と同じ URL でほぼ毎日 (ほぼ) 公開されている PDF ファイルがあります。

私がやりたいことは次のとおりです。

  1. リモートファイルが更新された場合にのみファイルをダウンロードします (更新されてもファイルは常に同じ名前を保持するため、これは私にとっては困難です。ファイルサイズを確認することは可能でしょうか?);
  2. サーバーの日付に従ってファイルの名前を変更します(システムの日付ではありません。サーバーとの差は9時間です)。
  3. スクリプトを自動化して、12 時間ごとにファイルをチェックします。

PS: と の両方がインストールされた Mac がありCURLますWGET

ありがとう!

4

1 に答える 1

0

ここでの解決策はタイムスタンプです: http://www.gnu.org/software/wget/manual/html_node/Time_002dStamping.html#Time_002dStamping

wget -N を使用して 12 時間ごとに cron ジョブを設定すると、うまくいくはずです。これにより、PDF のヘッダーがチェックされ、新しいかどうかが確認され、そうでない場合はダウンロードされません。PDF のタイムスタンプでプルダウンされるため、bash スクリプトを記述して ls -l の出力を取得し、mtime を探し、それを使用してファイルの名前を変更できます。

于 2012-10-23T13:22:53.537 に答える