次のような HTML ページからデータを抽出する必要があります。
<li>
<h2>
<a href="/rss/Football/actu_rss_35.xml" target="_blank" class="rss"><span>rss</span></a>AC Ajaccio</h2>
<div class="club-left">
<a href="/Football/FootballFicheClub35.html" title="AC Ajaccio"><img src="http://medias.lequipe.fr/logo-football/35/60?CCH-13-40" width="60" height="60"></a>
</div>
<div class="club-right">
<ul class="club-links">
<li><span class="plus"></span>
<a href="/Football/FootballFicheClub35.html">Fiche club </a>
</li>
<li><span class="plus"></span>
<a href="/Football/FootballFicheClub35.html#Calendrier">Calendrier</a>
</li>
<li><span class="plus"></span><a href="/Football/FootballFicheClub35.html#Effectif">Effectif</a>
</li>
<li><span class="plus"></span>
<a href="/Football/FootballFicheClub35.html#Joueurs">Stats joueurs</a>
</li>
<li><span class="plus"></span>
<a href="/Football/FootballFicheClub35.html#Statistiques">Stats club</a>
</li>
</ul>
</div>
<div class="clubt hidden">35</div>
<div class="clear"></div>
</li>
PHP で href 値とこの部分のテキストを抽出したいと思います。
<a href="**/Football/FootballFicheClub35.html#Joueurs**">**Stats joueurs**</a>
次のコードを使用していますが、何かが欠けています。
$elements = $xpath->query("//div[@id='Base']/ul/li");
if (!is_null($elements)) {
foreach ($elements as $element) {
$nodes = $element->childNodes;
foreach ($nodes as $node) {
if($node->nodeName!='#text'){
echo $node->nodeValue.";<br/>";
$stringData = trim($node->nodeValue).";";
}
}
}