wget を使用して、リダイレクトされた Web サイト URL のリストを 1 つのファイルに記録する方法を見つけようとしていました。例えば:
www.website.com/1234
にリダイレクトするようになりましたwww.newsite.com/a2as4sdf6nonsense
と
www.website.com/1235
にリダイレクトするようになりましたwww.newsite.com/ab6haq7ah8nonsense
Wget はリダイレクトを出力しますが、新しい場所を記録しません。ターミナルでこれを取得します:
HTTP request sent, awaiting response...301 moved permanently
Location: http.www.newsite.com/a2as4sdf6
...
その新しい URL をファイルにキャプチャしたいだけです。
私はこのようなものを使用していました:
for i in `seq 1 9999`; do
wget http://www.website.com/$i -O output.txt
done
しかし、これは各 Web ページのソースコードをそのファイルに出力します。リダイレクト情報のみを取得しようとしています。また、新しい URL を取得するたびに、同じ出力ファイルに新しい行を追加したいと考えています。
出力を次のようにしたいと思います。
www.website.com/1234 www.newsite.com/a2as4sdf6nonsense
www.website.com/1235 www.newsite.com/ab6haq7ah8nonsense
...