こんにちは、URI がサーバー リダイレクトによって解決されるページを解析する必要があります。
例:
http://www.juventus.com/wps/poc?uri=wcm:oid:91da6dbb-4089-49c0-a1df-3a56671b7020がリダイレクトされましたhttp://www.juventus.com/wps/wcm/connect/ JUVECOM-IT/news/primavera%20convocati%20villar%20news%2010agosto2013?pragma=no-cache
これは、解析する必要があるページの URI です。問題は、リダイレクト URI にスペースが含まれていることです。これがコードです。
String url = "http://www.juventus.com/wps/poc?uri=wcm:oid:91da6dbb-4089-49c0-a1df-3a56671b7020";
Document doc = Jsoup.connect(url).get();
Element img = doc.select(".juveShareImage").first();
String imgurl = img.absUrl("src");
System.out.println(imgurl);
2 行目に次のエラーが表示されます。
Exception in thread "main" org.jsoup.HttpStatusException: HTTP error fetching URL. Status=404, URL=http://www.juventus.com/wps/wcm/connect/JUVECOM-IT/news/primavera convocati villar news 10agosto2013?pragma=no-cache
これは、リダイレクトされた URL を含むため、JSoup が正しいリダイレクトされた URI を取得することを意味します。問題なく解析できるように、「 」を %20 に置き換える方法はありますか?
ありがとう!