以下のhtmlコードなど、htmlコードから画像のURLを抽出したかったのです。
<div class="imageContainer">
<img src="http://ecx.images-amazon.com/images/I/41%2B7N48F7JL._SL135_.jpg"
alt="" width="135" height="94"
style="margin-top: 21px; margin-bottom:20px;" /></div>
そして、ネットからコードを取得しました
String regexImage = "(?<=<img (*)src=\")[^\"]*";
Pattern pImage = Pattern.compile(regexImage);
Matcher mImage = pImage.matcher(elementString);
while (mImage.find()) {
String imagePath = mImage.group();}
これは機能しており、 re(regular expression) を持っています
"(?<=<img src=\")[^\"]*"
しかし今、私は以下のようなhtmlコードから画像のURLを抽出したい:
<img onerror="img_onerror(this);" data-logit="true" data-pid="MOBDDDBRHVWQZHYY"
data-imagesize="thumb"
data-error-url="http://img1a.flixcart.com/mob/thumb/mobile.jpg"
src="http://img8a.flixcart.com/image/mobile/h/y/y/samsung-galaxy-s-duos-s7562-125x125-imadddczzr4qhqnc.jpeg"
alt="Samsung Galaxy S Duos S7562: Mobile"
title="Samsung Galaxy S Duos S7562: Mobile"></img></a>
<div class="bp-offer-image image-offer"></div>
img と src= の間にコードがある場所
正規表現 as を試して"(?<=<img (*)src=\")[^\"]*"
いますが、うまくいきません。http://ecx.images-amazon.com/images/I/61xqOQ3Sj8L._SL135_.jpg
上記のhtmlコードから画像のURLを抽出できるように、正規表現を教えてください 。
そして、最初に Jsoup を使用して html を解析し、 img を含むタグを抽出します。
doc = Jsoup.connect(urlFromBrowse).get();
Elements elements = doc.getElementsByTag("img");
for (Element element : elements) {
String elementString = element.toString();
この elementString を matcher() メソッドに渡しました。そして、取得しているタグ(要素)から、正規表現を使用して画像のURL、名前などを解析しています。