サイトの機能などの最近のニュースを作成しようとしています。このために、私はWebクローラーを作成し、次のことを行うことで、これまでページからリンクを収集できました
$dom = new domDocument;
@$dom->loadHTML(file_get_contents($url));
$dom->preserveWhiteSpaces = false;
$linksToStore = $dom->getElementsByTagName('a');
foreach($linksToStore as $tag){
$links[$tag->getAttribute('href')]= $tag->childNodes->item(0)->nodeValue;
}
私の場合は「医療」である特定のドメインに関連するリンクが指すページからコンテンツを取得するにはどうすればよいですか??