シンプルなHTMLページのタイトル、説明、キーワードをスクレイプするためのシンプルな3つの関数を作成しました。これは、タイトルをスクレイプする最初の関数です。
function getPageTitle ($url)
{
$content = $url;
if (eregi("<title>(.*)</title>", $content, $array)) {
$title = $array[1];
return $title;
}
}
それはうまく機能し、それらは説明とキーワードをこすり取る2つの機能と機能しないものです
function getPageKeywords($url)
{
$content = $url;
if ( preg_match('/<meta[\s]+[^>]*?name[\s]?=[\s\"\']+keywords[\s\"\']+content[\s]?=[\s\"\']+(.*?)[\"\']+.*?>/i', $content, $array)) {
$keywords = $array[1];
return $keywords;
}
}
function getPageDesc($url)
{
$content = $url;
if ( preg_match('/<meta[\s]+[^>]*?name[\s]?=[\s\"\']+description[\s\"\']+content[\s]?=[\s\"\']+(.*?)[\"\']+.*?>/i', $content, $array)) {
$desc = $array[1];
return $desc;
}
}
preg_match行に何か問題があるかもしれないことは知っていますが、実際に多くのことを試したのかわかりませんが、機能しません