0

CURL リクエストを介してデータを取得しています。HTML の解析中に、属性を持つスパンがきちんと解析されていません。

HTML コードのスニペット

<div class="ftlt" style="width:250px;">
    <div class="tdiv"><span class="prop_price_img"></span><span class="property_price">PROPERTY_PRICE</span></div>
    <p class="adPrice">AREA</p>
    <h4>
      <p style="float:left;width:251px;font-family:Arial, Helvetica, sans-serif;font-size:13px;padding:2px 10px 10px 0px;"><a href="some link" title="title">TITLE</a>,
                  <span style="color:#666;"> CITY_NAME.</span> 

                <a title="title, Sale" style="color:#3266CC;font-size:12px;text-decoration:underline;">View on map</a></p>
    </h4>
    <p style="font-weight:bold;color:#666;">
           Premium
          </p>
    <div class="clr"></div>
  </div>

CITY_NAME 要素にきちんとアクセスする必要があります。私はHTML DOMを介してそのノードをフェッチすることができました

$spans = $html->find(div.ftlt span);
$city_value=strip_tags($spans[2]);

これ$city_valueは変形しています。removeAttribute メソッドを試しましたが、適切に行っていない可能性があります。

正規表現を適用できる場合、その方法を知りたいですか?

4

1 に答える 1

0
$spans = $html->find(div.ftlt span);
$city_value=$spans[2]->nodeValue;

nodeValueを使用しないのはなぜですか?

于 2012-07-13T10:04:45.117 に答える