php - PHPでHTMLセクションから値を抽出する方法

Question

次のような HTML ページからデータを抽出する必要があります。

<li>
    <h2>
        <a href="/rss/Football/actu_rss_35.xml" target="_blank" class="rss"><span>rss</span></a>AC Ajaccio</h2>
    <div class="club-left">
        <a href="/Football/FootballFicheClub35.html" title="AC Ajaccio"><img src="http://medias.lequipe.fr/logo-football/35/60?CCH-13-40" width="60" height="60"></a>
    </div>
    <div class="club-right">
        <ul class="club-links">
            <li><span class="plus"></span>
                <a href="/Football/FootballFicheClub35.html">Fiche club </a>
            </li>
            <li><span class="plus"></span>
                <a href="/Football/FootballFicheClub35.html#Calendrier">Calendrier</a>
            </li>
            <li><span class="plus"></span><a href="/Football/FootballFicheClub35.html#Effectif">Effectif</a>
            </li>
            <li><span class="plus"></span>
                <a href="/Football/FootballFicheClub35.html#Joueurs">Stats joueurs</a>
            </li>
            <li><span class="plus"></span>
                <a href="/Football/FootballFicheClub35.html#Statistiques">Stats club</a>
            </li>
        </ul>
    </div>
    <div class="clubt hidden">35</div>
    <div class="clear"></div>
</li>

PHP で href 値とこの部分のテキストを抽出したいと思います。

<a href="**/Football/FootballFicheClub35.html#Joueurs**">**Stats joueurs**</a>

次のコードを使用していますが、何かが欠けています。

$elements = $xpath->query("//div[@id='Base']/ul/li");
if (!is_null($elements)) {
  foreach ($elements as $element) {
    $nodes = $element->childNodes;
    foreach ($nodes as $node) {
        if($node->nodeName!='#text'){
            echo $node->nodeValue.";<br/>";
            $stringData = trim($node->nodeValue).";";
        }
    }
}

php - PHPでHTMLセクションから値を抽出する方法

1 に答える 1

Related

Reference