2

私はページ追跡 Web アプリに取り組んでおり、サイトのリストの正規ドメインを取得したいと考えています。私の知る限り、サイトのサブドメインとトップ レベル ドメインの所有権がどこで始まり、どこで終わるかを知る良い方法はありません。それを説明する最良の方法がわからないので、ここに例を示します。

個人の URL を所有している場合、、mysite.comなどのサブドメインを設定できます。www.mysite.comcdn.mysite.com

私の「グループ」が のような大学のウェブサイトを持っている場合、私computerscience.myuni.eduも を制御できたかもしれませんが、そうではありwww.computerscience.myuni.eduませんでした。myuni.edu

私が巨大なビジネスであり、Web トラフィックを分散させる必要がある場合、、、、などもあるかもしれwww.acme.comませww2.acme.comww3.acme.com

したがって、確かなことは何もありませんが、URLが与えられた場合、おそらく、、、、、www.およびww2.おそらくcdn.前面secure.から取り除くことができますが、私が考えていない他の一般的な「サブドメイン」はかなり一般的であり、一般的にはありませんか?別のウェブサイトを提供するために使用されますか?

サイトの実際の「正規の」ドメイン名を取得する最善の方法を見つけようとしているだけだと思います。

4

1 に答える 1

2

まず、ドメイン名とWebサイト/URLを区別する必要があります。ウェブサイトの所有者を簡単に特定する効率的な方法はなかったと思いますが、ドメイン名に関しては、その構造から推測することができます。

大まかに言って、完全修飾ドメイン名は、サブドメイン、名前、およびサフィックスで構成さますこの場合、正規のドメイン名名前+サフィックス)を探しています。

完全修飾ドメイン名の分解

ドメインネームシステムは階層的であるため、次のようなFQDNをwww.example.com.最後から最初まで読み取る必要があります。次の.com.example.wwwように分解できます。

  • 接尾辞com
  • 名前example
  • サブドメインwww

身元確認のために、同じ順序で続行する必要があります。

  1. サフィックス:名前が登録されているサフィックスを検索します(.com、.net、.co.uk、.com.es
  2. 名前:ドットの直後の名を識別します
  3. サブドメイン:文字列の残りの部分を削除します。

すべての公開サフィックスをリストした公式データベースはありませんが、Mozilla Foundationの主導により、非公式データベースが作成されました。このプロジェクトの名前はPublicSuffixです。これは、サフィックスを記録することを目的としています。このサフィックスの下で、ドメイン名を登録し、データベースを解析するためのいくつかの実装を行うことができます。

私の個人的なブログに、ドメインネームシステムを紹介する記事を書きました。興味があれば、ドメイン名の構造について詳しく説明します。ドメイン名とは何か、舞台裏は何ですか。

于 2012-01-05T20:14:20.147 に答える