2,50,000を超えるWebサイトのURLがリストされたテキストドキュメントがあります。各URLを調べて、特定のURL(別のサイト)にリダイレクトされる場合は、別のテキストファイルに保存したいと思います。
私はC#開発者であり、ファイルや小さな断片の読み取りまたは書き込みの方法を知っていますが、可能な限り任意のプログラミング言語で上記のタスクとスクリプトを実行するための最良のロジックまたは方法を探しています。
2,50,000を超えるWebサイトのURLがリストされたテキストドキュメントがあります。各URLを調べて、特定のURL(別のサイト)にリダイレクトされる場合は、別のテキストファイルに保存したいと思います。
私はC#開発者であり、ファイルや小さな断片の読み取りまたは書き込みの方法を知っていますが、可能な限り任意のプログラミング言語で上記のタスクとスクリプトを実行するための最良のロジックまたは方法を探しています。
string url = "http://www.google.com";
var req = (HttpWebRequest)HttpWebRequest.Create(url);
req.AllowAutoRedirect = false;
using (var resp = req.GetResponse())
{
var location = resp.Headers["Location"];
if (!String.IsNullOrEmpty(location))
{
Console.WriteLine("url is redirected to " + location);
}
}
bash スクリプトを使用します。何かのようなもの
#!/bin/bash
$SITESFILE=/path/to/your/input/file
$OUTPUTFILE=/path/to/your/output/file
$TARGETURL=http://where.to/redirect
for SITE in `cat $SITESFILE`; do
REDIRHEADER=`curl -i $SITE | head -n15 | grep -i 'Location: $TARGETURL'`
test -n "$REDIRHEADER" && echo $SITE >> $OUTPUTFILE
done;
cURL をインストールする必要があります。