0

私のプロジェクトには、HTML ページを解析してメタ タグを正しく取得する PHP 関数があります。問題の aspx ページでメタ タグが正しく設定されていても、aspx ページに対して関数を実行すると失敗し、戻りデータが作成されません。

機能は次のとおりです。

function getUrlData($url)
{
$result = false;

$contents = getUrlContents($url);

if (isset($contents) && is_string($contents))
{
    $title = null;
    $metaTags = null;

    preg_match('/<title>([^>]*)<\/title>/si', $contents, $match );

    if (isset($match) && is_array($match) && count($match) > 0)
    {
        $title = strip_tags($match[1]);
    }

    preg_match_all('/<[\s]*meta[\s]*name="?' . '([^>"]*)"?[\s]*' . 'content="?     ([^>"]*)"?[\s]*[\/]?[\s]*>/si', $contents, $match);

    if (isset($match) && is_array($match) && count($match) == 3)
    {
        $originals = $match[0];
        $names = $match[1];
        $values = $match[2];

        if (count($originals) == count($names) && count($names) == count($values))
        {
            $metaTags = array();

            for ($i=0, $limiti=count($names); $i < $limiti; $i++)
            {
                $metaTags[$names[$i]] = array (
                    'html' => htmlentities($originals[$i]),
                    'value' => $values[$i]
                );
            }
        }
    }

    $result = array (
        'title' => $title,
        'metaTags' => $metaTags
    );
}

return $result;
}

function getUrlContents($url, $maximumRedirections = null, $currentRedirection = 0)
{
$result = false;

$contents = @file_get_contents($url);

// Check if we need to go somewhere else

if (isset($contents) && is_string($contents))
{
    preg_match_all('/<[\s]*meta[\s]*http-equiv="?REFRESH"?' . '[\s]*content="?[0-9]*;[\s]*URL[\s]*=[\s]*([^>"]*)"?' . '[\s]*[\/]?[\s]*>/si', $contents, $match);

    if (isset($match) && is_array($match) && count($match) == 2 && count($match[1]) == 1)
    {
        if (!isset($maximumRedirections) || $currentRedirection < $maximumRedirections)
        {
            return getUrlContents($match[1][0], $maximumRedirections, ++$currentRedirection);
        }

        $result = false;
    }
    else
    {
        $result = $contents;
    }
}

return $contents;
}

aspx ページからメタ タグを読み取るにはどうすればよいですか?

前もって感謝します

午前

4

1 に答える 1

0

get_meta_tagsを使用してこれを行う簡単な方法があるかもしれません

例えば

<?php

// Load
$tags = get_meta_tags('http://www.example.com/');

// Debug
echo "<pre>";
print_r($tags);
echo "</pre>";

?>
于 2013-11-06T12:35:06.070 に答える