正規表現を使用してすべてのHTML要素を取得するためのトリックはありますか?たとえば、このHTMLスニペットを見てください。
<div>
<p>test
<span>blub</span></p>
</div>
正しい順序で:
array(
0=>'<div>
<p>test
<span>blub</span></p>
</div>',
1=>'<p>test
<span>blub</span></p>'
2=>'<span>blub</span>'
)
私は何かを考えました
(<([A-z]+)[^>]*>.*?</\2>)