0

サイトの機能などの最近のニュースを作成しようとしています。このために、私はWebクローラーを作成し、次のことを行うことで、これまでページからリンクを収集できました

$dom = new domDocument;
@$dom->loadHTML(file_get_contents($url));
$dom->preserveWhiteSpaces = false;
$linksToStore = $dom->getElementsByTagName('a');

foreach($linksToStore as $tag){
    $links[$tag->getAttribute('href')]= $tag->childNodes->item(0)->nodeValue;
}

私の場合は「医療」である特定のドメインに関連するリンクが指すページからコンテンツを取得するにはどうすればよいですか??

4

1 に答える 1

0

このhttp://simplehtmldom.sourceforge.net/ライブラリを使用して、ページからコンテンツを抽出します。セレクターは jQuery と同じように機能するため、コンテンツの抽出が非常に使いやすく効率的になります。

また、詳細については、 http://davidwalsh.name/php-notificationsを 確認してください。

于 2012-11-25T08:24:29.727 に答える