0

から部分的なhtmlファイルを読み取って解析する方法を探していますInputStream。入力が次のようになっているとします。

<html>
    <head>
        <meta something="something">

理想的な解決策は、そのタグを確認した後、どこかに保存して接続を閉じることです。この場合、HTML が適切に形成されていない可能性があり (一部しか取得していないため)、xml パーサーが失敗する可能性があります。それを行う方法はありますか?

4

1 に答える 1

1

使用できますJSoup

String partialHtml = "<html><head><meta something=\"something\">";
Document document = Jsoup.parse(partialHtml);
Elements values = document.getElementsByAttribute("something");
for (Element el : values) {
    System.out.println(el.attr("something"));
}
于 2013-09-06T18:48:41.070 に答える