1

特定のdiv内のテキストについてHTMLページをスキャンするにはどうすればよいですか?

4

4 に答える 4

2

これを行う最も簡単な方法は、SimpleHTMLDOMパーサーを使用することです。

// Create a DOM object from a URL
$html = file_get_html('http://www.google.com/');    

// Find all <div> which attribute id=foo
$ret = $html->find('div[id=foo]');
于 2009-12-28T20:28:48.863 に答える
0

preg_match()必要なサブストリングに一致させるか、dom/xmlを使用します。

于 2009-12-28T20:29:19.033 に答える
0

DOMDocumentクラスを使用してこれを行うこともできます。

使用法は非常に簡単です。

$dom = new DOMDocument();
$dom->loadHTML(file_get_contents($url));

// Example:
$dom->getElementById('foo');

ドキュメントはこちらです。

実際の使用例はここにあります。

于 2009-12-28T20:45:12.283 に答える
0

他の人が提案した組み込み機能を使用することも、SimpleHTMLDOMパーサーが単純なPHPクラスといくつかのヘルパー関数として実装されていることを試すこともできます。CSSセレクタースタイルの画面スクレイピング(jQueryなど)をサポートし、無効なHTMLを処理でき、DOMを操作するための使い慣れたインターフェイスも提供します。

http://simplehtmldom.sourceforge.net/でチェックする価値があります

于 2010-01-03T09:05:55.890 に答える