php - ページのコンテンツを取得する方法

Question

サイトの機能などの最近のニュースを作成しようとしています。このために、私はWebクローラーを作成し、次のことを行うことで、これまでページからリンクを収集できました

$dom = new domDocument;
@$dom->loadHTML(file_get_contents($url));
$dom->preserveWhiteSpaces = false;
$linksToStore = $dom->getElementsByTagName('a');

foreach($linksToStore as $tag){
    $links[$tag->getAttribute('href')]= $tag->childNodes->item(0)->nodeValue;
}

私の場合は「医療」である特定のドメインに関連するリンクが指すページからコンテンツを取得するにはどうすればよいですか??

score 0 · Accepted Answer

このhttp://simplehtmldom.sourceforge.net/ライブラリを使用して、ページからコンテンツを抽出します。セレクターは jQuery と同じように機能するため、コンテンツの抽出が非常に使いやすく効率的になります。

また、詳細については、 http://davidwalsh.name/php-notificationsを確認してください。

php - ページのコンテンツを取得する方法

1 に答える 1

Related

Reference