コード:
string sURL = "http://subdomain.website.com/index.htm";
MessageBox.Show(new System.Uri(sURL).Host);
「subdomain.website.com」が表示されます
しかし、どの URL や Web リンクにもメイン ドメイン "website.com" が必要です。
それ、どうやったら出来るの?
これを行うと、ホスト名の最後の 2 つのセグメントだけを取得できます。
string[] hostParts = new System.Uri(sURL).Host.Split('.');
string domain = String.Join(".", hostParts.Skip(Math.Max(0, hostParts.Length - 2)).Take(2));
またはこれ:
var host = new System.Uri(sURL).Host;
var domain = host.Substring(host.LastIndexOf('.', host.LastIndexOf('.') - 1) + 1);
この方法では、少なくとも 2 つのドメイン名部分が含まれていることがわかりますが、2 文字以下の中間部分も含まれます。
var host = new System.Uri(sURL).Host;
int index = host.LastIndexOf('.'), last = 3;
while (index > 0 && index >= last - 3)
{
last = index;
index = host.LastIndexOf('.', last - 1);
}
var domain = host.Substring(index + 1);
localhost
これにより、example.com
、 、などのドメインが処理されますexample.co.uk
。これは最善の方法ではありませんが、少なくともトップレベル ドメインの膨大なリストを作成する手間を省くことができます。
これを試すことができます。これは、配列で定義すると、多くの種類のルート ドメインを処理できます。
string sURL = "http://subdomain.website.com/index.htm";
var host = new System.Uri(sURL).Host.ToLower();
string[] col = { ".com", ".cn", ".co.uk"/*all needed domain in lower case*/ };
foreach (string name in col)
{
if (host.EndsWith(name))
{
int idx = host.IndexOf(name);
int sec = host.Substring(0, idx - 1).LastIndexOf('.');
var rootDomain = host.Substring(sec + 1);
}
}
using System.Text.RegularExpressions;
string sURL = "http://subdomain.website.com/index.htm";
string sPattern = @"\w+.com";
// Instantiate the regular expression object.
Regex r = new Regex(sPattern, RegexOptions.IgnoreCase);
// Match the regular expression pattern against a text string.
Match m = r.Match(sUrl);
if (m.Success)
{
MessageBox.Show(m.Value);
}