URLを指定して、パブリックサフィックスリスト(有効なTLDのリスト、たとえばこのリスト)を使用して登録済みドメインを抽出するにはどうすればよいですか?
たとえば、考慮a.bg
は有効なパブリックサフィックスです。
http://www.test.start.a.bg/hello.html -> start.a.bg
http://test.start.a.bg/ -> start.a.bg
http://test.start.abc.bg/ -> abc.bg (.bg is the public suffix)
パブリックサフィックスはTLDに応じて複数のレベルで構成される可能性があるため、これは単純な文字列操作を使用して行うことはできません。
PSリスト(データベースまたはフラットファイル)の読み取り方法は関係ありませんが、リストはローカルでアクセスできる必要があるため、常に外部サービスに依存しているわけではありません。