URLからドメイン名を抽出する方法を知りたい
HTMLファイルにデータがあります:
<a href='http://google.com.site.com'>google.com</a><br /><a href='http://youtube.com.site.com'>youtube.com</a><br />
完全なハイパーリンクを取得できます
preg_match_all ("/a[\s]+[^>]*?href[\s]?=[\s\"\']+".
"(.*?)[\"\']+.*?>"."([^<]+|.*?)?<\/a>/",
$var, &$matches);
$matches = $matches[1];
$list = array();
sort($matches);
しかし、タグの間にあるとgoogle.com
を抽出したいと思います。では、どうすれば抽出できますか?youtube.com
<a> and </a>
google.com
youtube.com