PHP のget_meta_tags()
関数を使用して、さまざまな Web ページのメタ タグを取得しています。<h1>
Web ページのタグのコンテンツを取得する最良の方法を知りたいです。を使用するfile_get_contents()
必要がありますか、それともより良い方法がありますか?
質問する
2018 次
4 に答える
4
はい、私は使用します:
$page = file_get_contents('http://example.com');
$matches = array();
preg_match( '#<h1>(.*?)</h1>#', $page, $matches );
あなたの情報は$matches
于 2012-08-02T03:15:30.940 に答える
1
file_get_contents()
ページのコンテンツを取得するために機能します。コンテンツを取得したら、h1
タグを抽出する方法はあなた次第です。
h1
最初のタグの内容を返す単純な正規表現を試すことができます。
$contents = file_get_contents($url);
preg_match_all("/<h1>(.*?)<\/h1>/", $contents, $matches);
$h1 = $matches[1];
ただし、HTML を扱うときは DOM パーサーを使用することを好みます。PHP Simple HTML DOM Parserは非常に使いやすいです。何かのようなもの:
$contents = file_get_contents($url);
$html = str_get_html($contents);
$h1 = $html->find("h1")[0];
注: これらのコード スニペットはテストしていません。始めるためのサンプルです。
于 2012-08-02T03:23:12.037 に答える
0
Simple HTML DOMを使用してみてください。
コード:
<?php
require_once('simple_html_dom.php');
$raw = '<h1>blah</h1>'; // Set the raw HTML of the webpage here
$html = str_get_html($raw);
$h1 = $html->find('h1', 0)->plaintext;
echo $h1;
?>
于 2012-08-02T03:15:43.863 に答える