シンプルなhtml domパーサーを使用してWebサイトをスクレイピングしています...ループ中に特定のクラスをスキップするにはどうすればよいですか
1126 次
2 に答える
1
http://simplehtmldom.sourceforge.net/manual.htm#frag_find_attrから判断すると、次を使用できます。
->find("div[class!=skip_me]")
または、DOM メソッドを使用して、値に対してチェックし->getAttribute("class")
ます。
于 2011-01-16T10:40:03.873 に答える
0
// DOM can load HTML soup. But, HTML soup can throw warnings, suppress
// them.
$htmlDom = new DOMDocument();
@$htmlDom->loadHTML($html);
if ($htmlDom) {
// It's much easier to work with simplexml than DOM, luckily enough
// we can just simply import our DOM tree.
$elements = simplexml_import_dom($htmlDom);
これは Drupal 7 SimpleTest からの (ほぼ) 引用です。この後、ドキュメントでの作業ははるかに簡単になり、クラスは $element['class'] として到達できます
于 2011-01-16T11:25:15.247 に答える