MSWord から NicEdit RTE に貼り付けた html からジャンク タグを削除しています。
<OL>
<LI>Hello</LI>
<P dir=ltr align=left>
<LI>Two</LI>
<P></P>
<P dir=ltr align=left>
<LI>Three</LI>
<P></P>
<P dir=ltr align=left>
<LI></LI>
<P></P></OL>
私はすでに、アプリケーションが使用していないタグを大量に削除しています。ただし、タグを使用しているため、貼り付けられ<p>
たすべてのタグを取り除くことはできません.<p>
およびタグ<p>
内のタグを削除するための高速な (必ずしも正確であるとは限りません) 手段が必要です。<ol>
<ul>
タグを</?p\s?.*?>
一致させる必要がありますが、内部にいるかp
どうかを確認する方法がわかりません。ol
ul