4

JTidyを使用してXHTMLDOM解析を実行しようとしていますが、これはかなり直感に反する作業のようです。特に、HTMLを解析する方法があります。

Node Tidy.parse(Reader, Writer)

そして、そのノードの<body />を取得するには、

Node Node.findBody(TagTable)

そのTagTableのインスタンスはどこで入手できますか?(コンストラクターは保護されており、それを製造する工場は見つかりませんでした。)

JTidy8.0-SNAPSHOTを使用しています。

4

2 に答える 2

6

体を抽出するためのはるかに簡単な方法があることがわかりました:

tidy = 新しい Tidy();
tidy.setXHTML(真);
tidy.setPrintBodyOnly(真);

次に、リーダーとライターのペアで tidy を使用します。

あるべきようにシンプルです。

于 2008-10-21T10:30:38.347 に答える
4

parseDOM代わりにメソッドを使用できます。これにより、org.w3c.dom.Document元に戻ります。

Document document = Tidy.parseDOM(reader, writer);
Node body = document.getElementsByTagName("body").item(0);
于 2008-10-21T09:47:27.293 に答える