PHP で不正な形式の XML を解析する際に問題が発生しています。特に、実際のデータで XML エンティティをエンコードせずに XML 形式でデータを返すサード パーティの Web サービスにクエリを実行しています。たとえば、エレメントの 1 つに引用符なしの ASCII ハート「<3」が含まれており、XML パーサーはこれを開始タグと見なします。'<3' である必要があります。
今のところ、単純に XML 文字列を SimpleXMLElement に渡しているだけですが、予想通り、これらのインスタンスでは失敗します。いろいろ調べてみたところ、PHP Tidy パッケージが役に立ちそうな気がしますが、できる構成の量は圧倒的です :(
したがって、他の誰かがこのような問題を抱えているかどうか、もしそうなら、どうやってそれを解決できたのか疑問に思っています.
ありがとう!