フォーラムからユーザーのビューと返信、およびヘッドのタイトルのみを抽出したい。このコードでは、URL を指定すると、コードはすべてを返します。title タグで定義されているスレッドの見出しと、div content タグの間にあるユーザーの返信のみが必要です。抽出方法を教えてください。これをtxtファイルに出力する方法を説明してください
package extract;
import java.io.*;
import org.jsoup.*;
import org.jsoup.nodes.*;
public class TestJsoup
{
public void SimpleParse()
{
try
{
Document doc = Jsoup.connect("url").get();
doc.body().wrap("<div></div>");
doc.body().wrap("<pre></pre>");
String text = doc.text();
// Converting nbsp entities
text = text.replaceAll("\u00A0", " ");
System.out.print(text);
}
catch (IOException e)
{
e.printStackTrace();
}
}
public static void main(String args[])
{
TestJsoup tjs = new TestJsoup();
tjs.SimpleParse();
}
}