0

このコードを使用する関数があり、何が間違っているのかを理解しようとしています。Web ページの RSS フィードがあればそれを見つけたいです。現時点では、URL は返されず、タイプが表示されますが、それだけです。また、blog_url キーは配列に設定されません。コードは次のとおりです。

  $results = array();
  $doc = new DOMDocument();
  @$doc->preserveWhiteSpace = FALSE;
  $html = file_get_contents($url);
  $doc->loadHTML("$html");

  $links = $doc->getElementsByTagName('link');
  foreach ($links as $tag) {
    $type = $tag->getAttribute('type');
    if (preg_match("/(rss+xml|atom+xml')/si", $type))
      $href_text = $tag->nodeValue;
      if(preg_match("/('feed|journal|blog')/si", $href_text))
        $results['blog_url'] = $tag->getAttribute('href');
  }
4

1 に答える 1

0
<?php

$url = ''; // EDIT THIS

$doc = new DOMDocument;
@$doc->loadHTMLFile($url);

$xpath = new DOMXPath($doc);
$nodes = $xpath->query('head/link[@rel="alternate"][@type="application/atom+xml" or @type="application/rss+xml"][@href]');

$result = array();

foreach ($nodes as $node) {
    $href = $node->getAttribute('href');
    if (preg_match('/(feed|journal|blog)/si', $href)) {
        $result['blog_url'] = $href;
        break;
    }
}

print_r($result);
于 2013-10-15T08:30:14.813 に答える