neko html を使用して html 文字列を w3c dom ドキュメントに解析しようとしていますが、ドキュメントは常に null です。これは、コードが使用されています:
try {
String html = readFile("C:/Users/thomas/Desktop/test.html");
InputStream is = new ByteArrayInputStream(html.getBytes("UTF-8"));
DOMParser parser = new DOMParser();
parser.parse(new InputSource(is));
Document document = parser.getDocument();
System.out.println(parser.getDocumentSource());
} catch (Exception e) {
System.out.println(e.getMessage());
}