7

jsoup を使用して、この Web ページからすべての画像 URL を抽出しようとしていますか? 誰でもそれを行う方法について助けを提供できますか? すべてのタグは次のようにフォーマットされていますが、ajaxsrc ではなく、src イメージのみが必要です。

<IMG ajaxsrc="/pics32/160/MP/MPYXBXTSYVKAKJQ.20110918032436.jpg" src="http://image.cdnllnwnl.xosnetwork.com/pics32/160/MP/MPYXBXTSYVKAKJQ.20110918032436.jpg">

リンクは次のとおりです: http://www.ncataggies.com/PhotoAlbum.dbml?DB_OEM_ID=24500&PALBID=417884

これはフォーマットですか?

        Document doc = null;
    try {
        doc = Jsoup.connect(articleLink).timeout(10000).get(); 
    } catch (IOException ioe) {
        return null;
    }
    Element content = doc.getElementById("div.thumb-image preview");
    Elements links = content.getElementsByAttribute("IMG");
    for (Element link : links) {
      String source = link.attr("src");
      Elements imageLinks = link.getElementsByAttribute(source);
      for(Element imageLink: imageLinks){
          //imageLink = picture link?
      }

}

そうではないようです。コードに print ステートメントがありますが、ヒットしません。

4

3 に答える 3

16

すべての img タグを取得するには、次のようにする必要があります。

for (Element e : doc.select("img")) {
    System.out.println(e.attr("src"));
}

これにより、すべての img タグが選択され、src 属性が取得されてコンソールに出力されます。

于 2012-05-07T12:39:39.620 に答える
1

この IMG による要素が既にあると仮定して、これを試してください。

文字列ソース = img.attr("src");

この attr メソッドは Node クラスから継承されます

HTH

于 2012-05-04T23:43:03.507 に答える
0
Document document = Jsoup.connect(" http://www.ncataggies.com/PhotoAlbum.dbml?DB_OEM_ID=24500&PALBID=417884").get();

        Elements elements =document.getElementsByTag("IMG");
        for(int i=0;i<elements.size();i++)
        {
            System.out.println("Sources of "+ i +":"+elements.get(i).attr("src"));
        }
于 2012-09-10T13:13:31.060 に答える