php - HTMLを正規表現で解析するには?

Question

重複の可能性:
PHP で HTML を解析および処理する方法は?

次の形式の多くのレコードを含む HTML ドキュメントがあります。

<tr><td>af</td><td>Afrikaans</td></tr>

教えてください、正規表現を使用して「af」と「アフリカーンス」を抽出するにはどうすればよいですか? ありがとうございました。

score 1 · Accepted Answer

これは開始するための簡単な例にすぎませんが、HTML の構造によっては、いくつかの調整が必要になる場合があります。

$s = <<<EOM
<tr><td>af</td><td>Afrikaans</td></tr>
EOM;

$d = new DOMDocument;
$d->loadHTML($s);
foreach ($d->getElementsByTagName('td') as $node) {
    echo $node->nodeValue;
}

DOMDocumentドキュメントも参照してください。

score 0 · Accepted Answer

XML を解析するには、正規表現の代わりに DOM、SAX、SimpleXML、PHPQuesry、tidy を使用する必要があります。

php - HTMLを正規表現で解析するには?

2 に答える 2

Related

Reference