多くの短い URL を含む txt ドキュメントがあります。各 URL は 1 行で区切られています。最終的なリンクを取得するために URL を解決したいです。また、一部の URL は 2 回リダイレクトされます。出力形式で最終的な URL を取得するためにこれを自動化する方法1行に1つのURLの?更新: 入力テキスト ファイル:
http://www.example.com/go/post-page-1
http://www.example.com/go/post-page-2
http://www.example.com/go/post-page-3
txt ファイルに必要な出力形式:
http://www.example.org/post-page-name
http://www.example.org/post-page-name
http://www.example.org/post-page-name
リンクがリダイレクトされる方法は次のとおりです。
Initial URL:http://www.example.com/go/post-page
==>301 Permanent Redirect
Intermediate url:http://click.affiliate.com/tracking?url=http://www.example.org/post-page-name
==>302 Temporary Redirect
Final URL: http://www.example.org/post-page-name
これは私が試したコードですが、URLを最終リンクに解決するのではなく、中間リンクに解決します。
#!/bin/bash
rm resolved_urls.txt
for url in $(cat url.txt); do
wget -S "$url" 2>&1 | grep ^Location >> resolved_urls.txt
done