私は Stax で Sgml 解析を行っています。Sgml には、「“ ”」などの文字が含まれており、UTF-8 の設定では置き換えられません。解析が中断し、次の例外がスローされます。
javax.xml.stream.XMLStreamException: ParseError at [row,col]:[6,22]
Message: The entity "lpar" was referenced, but not declared.
別の問題があります。たとえば<coolspan>
、 and tag のないタグがあります。これは解析を中断します。
すべての特殊文字を置き換え、終了タグなしでタグを検証するメソッドを作成することを考えていました。誰かがすでにこのような問題を通り過ぎており、フォローする方法を教えてもらえますか?