<div>
Webハーベスト(Javaから)でxqueryプロセッサを使用して、要素内に無効なタグを含むhtmlページを解析しています<div 3px="abc">
. 例外は次のとおりです。
SXXP0003: Error reported by XML parser: Element type "div" must be followed by either
attribute specifications, ">" or "/>".
at org.webharvest.runtime.processors.XQueryProcessor.execute(Unknown Source)
divの前処理をきれいにする簡単な方法はありますか? または、この問題の回避策はありますか?