html - 正規表現を使用してHTMLスニペットからすべてのHTML要素を取得するにはどうすればよいですか？

Question

正規表現を使用してすべてのHTML要素を取得するためのトリックはありますか？たとえば、このHTMLスニペットを見てください。

<div>
<p>test
<span>blub</span></p>
</div>

正しい順序で：

array(
0=>'<div>
<p>test
<span>blub</span></p>
</div>',

1=>'<p>test
<span>blub</span></p>'

2=>'<span>blub</span>'
)

私は何かを考えました

 (<([A-z]+)[^>]*>.*?</\2>)

score 1 · Accepted Answer

HTML を正規表現で解析することはできません。PHP またはその他の言語を使用して、HTML を解析します。

score 0 · Accepted Answer

速くて汚い

<[^>]+>

「>」を含む文字列がある場合、これが機能するとは思わないでください。

2 に答える 2