0

正規表現を使用してすべてのHTML要素を取得するためのトリックはありますか?たとえば、このHTMLスニペットを見てください。

<div>
<p>test
<span>blub</span></p>
</div>

正しい順序で:

array(
0=>'<div>
<p>test
<span>blub</span></p>
</div>',

1=>'<p>test
<span>blub</span></p>'

2=>'<span>blub</span>'
)

私は何かを考えました

 (<([A-z]+)[^>]*>.*?</\2>)
4

2 に答える 2

1

この質問を見てください: regex match html element with html children

HTML を正規表現で解析することはできません。PHP またはその他の言語を使用して、HTML を解析します。

于 2012-12-19T23:36:41.020 に答える
0

速くて汚い

<[^>]+>

「>」を含む文字列がある場合、これが機能するとは思わないでください。

于 2012-12-19T23:39:20.213 に答える