5

JsoupDOCTYPEを使用してページのを解析し、HTMLのバージョン(HTML 5HTML 4XHTMLなど)を検出したいと思います。

DOCTYPEそれを処理するためにJsoupでを解析することは可能ですか?そうでない場合は、ページHTMLのバージョンを検出するという主な目的を達成する方法がありますか?

4

1 に答える 1

9

JsoupDocumentTypeこの目的のためのクラスがあります:

List<Node>nods = doc.childNodes();
         for (Node node : nods) {
            if (node instanceof DocumentType) {
                DocumentType documentType = (DocumentType)node;
                  System.out.println(documentType.toString());
                  System.out.println(DocumentType.attr("publicid"));
            }
        }
于 2012-04-11T14:14:30.367 に答える