php - PHP：cURL、HTMLスキャンからのデータ

Question

特定のdiv内のテキストについてHTMLページをスキャンするにはどうすればよいですか？

score 2 · Accepted Answer

これを行う最も簡単な方法は、SimpleHTMLDOMパーサーを使用することです。

// Create a DOM object from a URL
$html = file_get_html('http://www.google.com/');    

// Find all <div> which attribute id=foo
$ret = $html->find('div[id=foo]');

score 0 · Accepted Answer

0

preg_match()必要なサブストリングに一致させるか、dom/xmlを使用します。

于 2009-12-28T20:29:19.033 に答える

score 0 · Accepted Answer

DOMDocumentクラスを使用してこれを行うこともできます。

使用法は非常に簡単です。

$dom = new DOMDocument();
$dom->loadHTML(file_get_contents($url));

// Example:
$dom->getElementById('foo');

ドキュメントはこちらです。

実際の使用例はここにあります。

score 0 · Accepted Answer

他の人が提案した組み込み機能を使用することも、SimpleHTMLDOMパーサーが単純なPHPクラスといくつかのヘルパー関数として実装されていることを試すこともできます。CSSセレクタースタイルの画面スクレイピング（jQueryなど）をサポートし、無効なHTMLを処理でき、DOMを操作するための使い慣れたインターフェイスも提供します。

http://simplehtmldom.sourceforge.net/でチェックする価値があります

php - PHP：cURL、HTMLスキャンからのデータ

4 に答える 4

Related

Reference