重複の可能性:
PHP で HTML を解析および処理する方法は?
次の形式の多くのレコードを含む HTML ドキュメントがあります。
<tr><td>af</td><td>Afrikaans</td></tr>
教えてください、正規表現を使用して「af」と「アフリカーンス」を抽出するにはどうすればよいですか? ありがとうございました。
重複の可能性:
PHP で HTML を解析および処理する方法は?
次の形式の多くのレコードを含む HTML ドキュメントがあります。
<tr><td>af</td><td>Afrikaans</td></tr>
教えてください、正規表現を使用して「af」と「アフリカーンス」を抽出するにはどうすればよいですか? ありがとうございました。
これは開始するための簡単な例にすぎませんが、HTML の構造によっては、いくつかの調整が必要になる場合があります。
$s = <<<EOM
<tr><td>af</td><td>Afrikaans</td></tr>
EOM;
$d = new DOMDocument;
$d->loadHTML($s);
foreach ($d->getElementsByTagName('td') as $node) {
echo $node->nodeValue;
}
DOMDocument
ドキュメントも参照してください。
XML を解析するには、正規表現の代わりに DOM、SAX、SimpleXML、PHPQuesry、tidy を使用する必要があります。