Java で文字列として HTML ページがあり、そこから JavaScript リンクを抽出する必要があります。私が使用できる優れた使いやすいライブラリはありますか? CobraとNekoを調べましたが、タグ固有のコンテンツを取得するなど、必要なものがあるとは思いません (間違っているかもしれません)。
user801154
質問する
854 次
1 に答える
1
JSoupを見てください。これは、dom の要素を見つけるためのセレクター DSL (ドメイン固有言語) を持つ HTML パーサーです。
たとえば、 を含むすべてのa
タグを検索するには、次のhref
ようにします。
Document doc = Jsoup.connect("http://www.google.com/").get();
Elements hrefAnchors = doc.select("a[href]");
html を として既にダウンロードしている場合は、次の方法String
を使用できます。parse(String)
String html = "<p>Welcome to <a href='http://www.google.com/'>Google</a>.</p>";
Document doc = Jsoup.parse(html);
于 2012-06-26T13:34:49.480 に答える