1

正規表現でこれを達成できると思いますが、そうでない場合は、文字列操作も実行可能な解決策です。

次の入力を有効にする必要があります。

  1. "http://open.thumbshots.org/image.pxf?url=www.party.com"
  2. "http://www.xclicks.net/sc/ct.php?s=9971&l=http%3A//www.google.com/imgres%3F"
  3. "http://whos.amung.us/pingjs/?k=yvybju40twbs&t=Mudswimmer%3A%20Spam%20%26%20Crap%3A%20Http%3AUniversity.com%3A%20No%20Animals%20Allowed..&c=c&y=htt"

次の出力に:

  1. "party.com"
  2. "google.com"
  3. "University.com"

URL のホスト名を取得しようとしているのではなく、クエリ文字列内の 2 番目のドメインが必要です。

4

2 に答える 2

1

少なくとも私にとっては、正規表現を含むすべてのものにある程度の不確実性がありますが、3つの入力を与えると次のコードが機能します。

string[] urls = new string[] 
{ 
    "http://open.thumbshots.org/image.pxf?url=www.party.com",
    "http://www.xclicks.net/sc/ct.php?s=9971&l=http%3A//www.google.com/imgres%3F",
    "http://whos.amung.us/pingjs/?k=yvybju40twbs&t=Mudswimmer%3A%20Spam%20%26%20Crap%3A%20Http%3AUniversity.com%3A%20No%20Animals%20Allowed..&c=c&y=htt"
};

foreach (var url in urls)
{
    var result = HttpUtility.ParseQueryString(new Uri(url, UriKind.Absolute).Query);

    foreach (string item in result)
    {
        string value = result.GetValues(item).Single();

        const string DomainNamePattern = "(?:www\\.|\\b)(?<domain>([a-z0-9]([-a-z0-9]*[a-z0-9])?\\.)+((a[cdefgilmnoqrstuwxz]|aero|arpa)|(b[abdefghijmnorstvwyz]|biz)|(cat|com|coop|c[acdfghiklmnorsuvxyz])|d[ejkmoz]|(e[ceghrstu]|edu)|f[ijkmor]|(g[abdefghilmnpqrstuwy]|gov)|h[kmnrtu]|(i[delmnoqrst]|info|int)|(j[emop]|jobs)|k[eghimnprwyz]|l[abcikrstuvy]|(m[acdghklmnopqrstuvwxyz]|mil|mobi|museum)|(n[acefgilopruz]|name|net)|(om|org)|(p[aefghklmnrstwy]|pro)|qa|r[eouw]|s[abcdeghijklmnortvyz]|(t[cdfghjklmnoprtvwz]|travel)|u[agkmsyz]|v[aceginu]|w[fs]|y[etu]|z[amw]))";

        var match = Regex.Match(
            value,
            DomainNamePattern,
            RegexOptions.IgnoreCase);

        if (match.Success)
        {
            string domain = match.Groups["domain"].Value;

            Console.WriteLine(domain);
        }
    }
}

使用される正規表現はここから採用されました。

これを実行すると、次の出力が得られます。

// party.com
// google.com
// University.com
于 2012-05-16T19:46:42.020 に答える
0

リンクに常に url クエリ文字列キーが含まれている場合は、単純にこれを取得できます。これにより String url = Request.QueryString["url"].ToString(); 、url の値が再実行されます。

于 2012-05-16T19:55:37.817 に答える