xml - クエリパスで問題のある XML を解析する (要素内のドット)

Question

NewsML (http://www.iptc.org/std/NewsML-G2/2.7/examples/LISTING2_NewsML-G2_Complete.xml) ドキュメントを querypath で解析しようとしています。しかし、私はいくつかの要素のドットに問題があり<body.head>ます.

一部の firefox querypath プラグインでは、バックスラッシュでドットをエスケープできますが、php pear ライブラリではこれが機能しません。

何か案は？

(回避策ではなく、クエリパス内の解決策を探しています)

score 0 · Accepted Answer

以前は、Tidy PHP拡張機能（http://us3.php.net/manual/en/book.tidy.php）を使用してHTML / XMLをクリーンアップしてから、QueryPathに渡しました。

上で参照したXMLは非常にクリーンで、非常に小さいものです。

唯一の問題が要素名のドットである場合、正規表現による前処理もおそらく機能します。そして、それは最速の解決策になるでしょう。私はあなたがpreg_replace('/<body\./g', '<body-', $xml)それをして修正してもらうことができると思います。（これは、などに置き換えbody.contentられbody-contentます。）

xml - クエリパスで問題のある XML を解析する (要素内のドット)

1 に答える 1

Related

Reference