php - curl URL、CSS、および画像を解析するには?

Question

重複の可能性:
プログラムで Web ページを保存するにはどうすればよいですか?

私はcurlを始めたばかりで、外部のWebサイトを取得することができました:

function get_data($url) {
  $ch = curl_init();
  $timeout = 5;
  curl_setopt($ch,CURLOPT_USERAGENT, $userAgent);
  curl_setopt($ch,CURLOPT_URL,$url);
  curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
  curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,$timeout);
  curl_setopt($ch,CURLOPT_FOLLOWLOCATION,true);
  $data = curl_exec($ch);
  curl_close($ch);
  return $data;
}
$test = get_data("http://www.selfridges.com");
echo $test;

ただし、CSS と画像は含まれていません。CSS と画像、基本的には Web サイト全体も取得する必要があります。CSS、画像、および URL を解析して作業を進める方法を理解するための簡単な方法を誰かが投稿してもらえますか?

score 1 · Accepted Answer

これを行うには、PHP よりも優れたツールがあります。パラメータwgetで。--page-requisites

ただし、自動スクレイピングは多くの場合、サイトの TOS に違反することに注意してください。

score 0 · Accepted Answer

PHP 用の HTML パーサーがあります。利用可能なものはかなりあります。これについて説明している投稿は次のとおりです。 PHP で HTML/XML をどのように解析および処理しますか?

php - curl URL、CSS、および画像を解析するには?

2 に答える 2

Related

Reference