最初に:私は一般を読みました。このようなXHTML引数でRegExを使用しないでください。RegExはXHTML自己完結型タグを除いてオープンタグと一致し、ネストされたXHTMLまたはXMLノードでRegExがどのように失敗するかを理解しています。
XMLの属性を操作するだけでRegExを使用すると壊れてしまう理由がわかりません。したがって、一般的な規則には例外があるようです。属性は常にaで始まり、その間にある他のノード<で終わる単一のノードに含まれているため、XMLが破損するため、このような事態は発生しません。>< or >
次に、含まれている可能性のあるマイクロデータのXHTML文字列をクリーンアップしたいと思います。これは、任意の属性、、、、itemscopeおよびです。このようなもの:itemtypeitempropitemiditemref
...
<body itemscope="itemscope" itemtype="http://schema.org/WebPage">
<div itemprop="maincontent">content</div>
...
PHPでこれを行うための最良の方法は何ですか?