正規表現について私よりも多くの知識を持っている人は、HTMLコードを分割して、すべてのタグとすべての単語が区切られるようにする方法を知っていますか.
<p>Some content <a href="www.test.com">A link</a></p>
次のように区切られます。
array = { [0]=>"<p>",
[1]=>"Some",
[2]=>"content",
[3]=>"<a href='www.test.com'>,
[4]=>"A",
[5]=>"Link",
[6]=>"</a>",
[7]=>"</p>"
これまで preg_split を使用してきましたが、文字列を空白で分割するか、タグで分割することに成功しましたが、これを分割する必要がある場合、すべてのコンテンツが 1 つの配列要素になります。
誰か助けて?