0

HTML内の重複する属性を削除/無視する必要があります。xerces2htmlパーサーを使用します。タグ内の属性が重複しているHTMLファイルは解析されません。

例:

<img src="url" width="100" height="200" width="123">
4

1 に答える 1

0

Cyber​​ neko html parser を試して、html ファイルを解析できます。 http://sourceforge.net/projects/nekohtml/

于 2013-02-08T08:45:12.023 に答える