WebサイトからPDFファイルをダウンロードしようとしています。ファイルの名前(例:foo.pdf )はわかっていますが、場所は数週間ごとに変更されます。
例: www.server.com/media/123456/foo.pdfがwww.server.com/media/245415/foo.pdf に変更されます
数字は常に6桁の数字なので、bashスクリプトを使用して1,000万個すべてを調べてみましたが、明らかに時間がかかります。
i=0
until [ "$RC" == "0" ] || [ $i == 1000000 ]
do
b=$(printf %06d $i)
wget -q http://www.server.com/media/${b}/foo.pdf -O bar.pdf
export RC=$?
i=$(($i + 1))
done
間違ったアドレスの場合、404エラーが発生します。
私は現在正しいアドレスの周りでそれをテストしました、そしてそれは働きます。
誰かがこの問題を解決するためのより速い方法を知っていますか?