1

PHP のget_meta_tags()関数を使用して、さまざまな Web ページのメタ タグを取得しています。<h1>Web ページのタグのコンテンツを取得する最良の方法を知りたいです。を使用するfile_get_contents()必要がありますか、それともより良い方法がありますか?

4

4 に答える 4

4

はい、私は使用します:

$page = file_get_contents('http://example.com');
$matches = array();
preg_match( '#<h1>(.*?)</h1>#', $page, $matches );

あなたの情報は$matches

于 2012-08-02T03:15:30.940 に答える
1

file_get_contents()ページのコンテンツを取得するために機能します。コンテンツを取得したら、h1タグを抽出する方法はあなた次第です。

h1最初のタグの内容を返す単純な正規表現を試すことができます。

$contents = file_get_contents($url);
preg_match_all("/<h1>(.*?)<\/h1>/", $contents, $matches);
$h1 = $matches[1];

ただし、HTML を扱うときは DOM パーサーを使用することを好みます。PHP Simple HTML DOM Parserは非常に使いやすいです。何かのようなもの:

$contents = file_get_contents($url);
$html = str_get_html($contents);
$h1 = $html->find("h1")[0];

: これらのコード スニペットはテストしていません。始めるためのサンプルです。

于 2012-08-02T03:23:12.037 に答える
0

<h1>タグはメタタグではないため、この機能は使用できませんget_meta_tags()。HTML ドキュメントのメタ タグは<head>、コンテンツ自体ではなく、ページに関する情報を含むセクション内のタグです。

PHP.DOMは、必要な情報を取得するためのおそらく最良の方法です。これは、うまく始めるための適切なチュートリアルへのリンクです。

于 2012-08-02T03:14:32.417 に答える
0

Simple HTML DOMを使用してみてください。

コード:

<?php
require_once('simple_html_dom.php');
$raw = '<h1>blah</h1>'; // Set the raw HTML of the webpage here
$html = str_get_html($raw);
$h1 = $html->find('h1', 0)->plaintext;
echo $h1;
?>
于 2012-08-02T03:15:43.863 に答える