各タグの値を抽出するこのサンプル コードがあります。それとは別に、そのタグのクラス名を取得します..
<?php
$doc = new DOMDocument;
$doc->loadxml( <<< eox
<tr class="calendar_row" data-eventid="42023">
<td class="date"/>
<td class="time">All Day</td>
<td class="currency">CAD</td>
<td class="impact">
<span title="Non-Economic" class="holiday"/>
</td>
<td class="event">
<span>Bank Holiday</span>
</td>
<td class="detail">
<a class="calendar_detail level1" data-level="1" title="Open Detail"/>
</td>
<td class="actual"/>
<td class="forecast"/>
<td class="previous"/>
<td class="graph"/>
</tr>
eox
);
$xpath = new DOMXPath($doc);
foreach( $xpath->query('//tr[@data-eventid="42023"]/td[@class]') as $n ) {
echo $n->nodeName.'-'.$n->nodeValue."<br />";
}
?>
上記のスニペットを使用すると、一部のタグが適切にフォーマットされていない場合でも、これらの値を取得したいだけです (Web ソースをスクラップしています)。DOMDocument XPath クエリでこれを行うにはどうすればよいですか。フェッチされる値が次のとおりであるため、問題が発生しています。
td-
td-All Day
td-CAD
td-
td-Bank Holiday
td-
td-
td-
td-
td-
それ以外の:
date-
time-All Day
currency-CAD
impact-
event-Bank Holiday
detail-
actual-
forecast-
previous-
graph-