JsoupDOCTYPE
を使用してページのを解析し、HTMLのバージョン(HTML 5、HTML 4、XHTMLなど)を検出したいと思います。
DOCTYPE
それを処理するためにJsoupでを解析することは可能ですか?そうでない場合は、ページHTMLのバージョンを検出するという主な目的を達成する方法がありますか?
Jsoup
DocumentType
この目的のためのクラスがあります:
List<Node>nods = doc.childNodes();
for (Node node : nods) {
if (node instanceof DocumentType) {
DocumentType documentType = (DocumentType)node;
System.out.println(documentType.toString());
System.out.println(DocumentType.attr("publicid"));
}
}