0

Java で文字列として HTML ページがあり、そこから JavaScript リンクを抽出する必要があります。私が使用できる優れた使いやすいライブラリはありますか? CobraNekoを調べましたが、タグ固有のコンテンツを取得するなど、必要なものがあるとは思いません (間違っているかもしれません)。

4

1 に答える 1

1

JSoupを見てください。これは、dom の要素を見つけるためのセレクター DSL (ドメイン固有言語) を持つ HTML パーサーです。

たとえば、 を含むすべてのaタグを検索するには、次のhrefようにします。

Document doc = Jsoup.connect("http://www.google.com/").get();
Elements hrefAnchors = doc.select("a[href]"); 

html を として既にダウンロードしている場合は、次の方法Stringを使用できます。parse(String)

String html = "<p>Welcome to <a href='http://www.google.com/'>Google</a>.</p>";
Document doc = Jsoup.parse(html);
于 2012-06-26T13:34:49.480 に答える