0

シンプルなhtml domパーサーを使用してWebサイトをスクレイピングしています...ループ中に特定のクラスをスキップするにはどうすればよいですか

4

2 に答える 2

1

http://simplehtmldom.sourceforge.net/manual.htm#frag_find_attrから判断すると、次を使用できます。

->find("div[class!=skip_me]")

または、DOM メソッドを使用して、値に対してチェックし->getAttribute("class")ます。

于 2011-01-16T10:40:03.873 に答える
0
  // DOM can load HTML soup. But, HTML soup can throw warnings, suppress
  // them.
  $htmlDom = new DOMDocument();
  @$htmlDom->loadHTML($html);
  if ($htmlDom) {
    // It's much easier to work with simplexml than DOM, luckily enough
    // we can just simply import our DOM tree.
    $elements = simplexml_import_dom($htmlDom);

これは Drupal 7 SimpleTest からの (ほぼ) 引用です。この後、ドキュメントでの作業ははるかに簡単になり、クラスは $element['class'] として到達できます

于 2011-01-16T11:25:15.247 に答える