私はJTidyを使用していくつかのオンラインのものをスクレイプしようとしましたが、この厄介なエラーが発生し、それを修正する方法やJTidyに無視させる方法がわかりません。
InputStream: Doctype given is "-//W3C//DTD XHTML 1.0 Transitional//EN"
InputStream: Document content looks like XHTML 1.0 Transitional
630 warnings, 1 error were found!
This document has errors that must be fixed before
using HTML Tidy to generate a tidied up version.
これはばかげたエラーのようです。他にエラーはないので、これがJTidyによるドキュメントの解析をブロックしているようです。HttpURLConnectionから直接InputStreamから解析しており、メソッドTidy.parseDomを使用しています。