から部分的なhtmlファイルを読み取って解析する方法を探していますInputStream
。入力が次のようになっているとします。
<html>
<head>
<meta something="something">
理想的な解決策は、そのタグを確認した後、どこかに保存して接続を閉じることです。この場合、HTML が適切に形成されていない可能性があり (一部しか取得していないため)、xml パーサーが失敗する可能性があります。それを行う方法はありますか?
使用できますJSoup
String partialHtml = "<html><head><meta something=\"something\">";
Document document = Jsoup.parse(partialHtml);
Elements values = document.getElementsByAttribute("something");
for (Element el : values) {
System.out.println(el.attr("something"));
}