スクレイピングしているWebサイトから次のものがありますが、残念ながらコンテンツにはいくつかのフォントタグも含まれており、将来的に他のインラインフォーマットが含まれる可能性があります. これを行うためにPHPQueryを使用していますが、PHPのみのソリューションも機能します。
<p>
<font
color="#cc0000">
<font
color="#000000">Content</font>
</font>
</p>
<p>Content</p>
<p>
<font
color="#cc0000">Content I wish to keep but font should be removed</font>
</p>
<p>
<font
color="#cc0000">Content I wish to keep but font should be removed</font>
</p>
<p>
<font
color="#cc0000">Content I wish to keep but font should be removed</font>
</p>
<p>
<font
color="#cc0000">Content I wish to keep but font should be removed</font>
</p>
<p>
<font
color="#000000">Content I wish to keep but font should be removed</font>
</p>
<p>Content</p>
</div>