java - JTidy Node.findBody（）—使用方法は？

Question

JTidyを使用してXHTMLDOM解析を実行しようとしていますが、これはかなり直感に反する作業のようです。特に、HTMLを解析する方法があります。

Node Tidy.parse(Reader, Writer)

そして、そのノードの<body />を取得するには、

Node Node.findBody(TagTable)

そのTagTableのインスタンスはどこで入手できますか？（コンストラクターは保護されており、それを製造する工場は見つかりませんでした。）

JTidy8.0-SNAPSHOTを使用しています。

score 6 · Accepted Answer

体を抽出するためのはるかに簡単な方法があることがわかりました：

tidy = 新しい Tidy();
tidy.setXHTML(真);
tidy.setPrintBodyOnly(真);

次に、リーダーとライターのペアで tidy を使用します。

あるべきようにシンプルです。

score 4 · Accepted Answer

parseDOM代わりにメソッドを使用できます。これにより、org.w3c.dom.Document元に戻ります。

Document document = Tidy.parseDOM(reader, writer);
Node body = document.getElementsByTagName("body").item(0);

2 に答える 2