0

NewsML (http://www.iptc.org/std/NewsML-G2/2.7/examples/LISTING2_NewsML-G2_Complete.xml) ドキュメントを querypath で解析しようとしています。しかし、私はいくつかの要素のドットに問題があり<body.head>ます.

一部の firefox querypath プラグインでは、バックスラッシュでドットをエスケープできますが、php pear ライブラリではこれが機能しません。

何か案は?

(回避策ではなく、クエリパス内の解決策を探しています)

4

1 に答える 1

0

以前は、Tidy PHP拡張機能(http://us3.php.net/manual/en/book.tidy.php)を使用してHTML / XMLをクリーンアップしてから、QueryPathに渡しました。

上で参照したXMLは非常にクリーンで、非常に小さいものです。

唯一の問題が要素名のドットである場合、正規表現による前処理もおそらく機能します。そして、それは最速の解決策になるでしょう。私はあなたがpreg_replace('/<body\./g', '<body-', $xml)それをして修正してもらうことができると思います。(これは、などに置き換えbody.contentられbody-contentます。)

于 2012-05-23T01:50:41.633 に答える