JSoup ライブラリを使用して Web ページのテキストを抽出しています。以下は私のコードです
Document doc;
try {
URL url = new URL(text);
doc = Jsoup.parse(url, 70000);
Elements paragraphs = doc.select("p");
for(Element p : paragraphs)
{
textField.append(p.text());
textField.append("\n");
}
}
catch (Exception ex)
{
ex.printStackTrace();
}
ここでは、「p」タグからのみテキストを取得できます。しかし、ページ内のすべてのテキストが必要です。どうすればいいですか?それはノードをループすることによるものかもしれませんが、私はJSoup
.