このドメインからURLのDocument.baseUri()を取得しようとすると-
http://www.deliciousmagazine.co.uk/articles/mid-week-meals
http://www.deliciousmagazine.co.ukを返します。
他のURLの場合、Document.baseUri()はURL全体を返します。
例えば
https://stackoverflow.com/about
戻ります
https://stackoverflow.com/about。
私が気付いた唯一のことは、HTML応答が次の情報を含むタグを返すことです。
<base href="http://www.deliciousmagazine.co.uk/" />
これがこの問題を引き起こしていると私が考えることができる唯一のことです。この要素が存在する場合でも、URL全体が必要な場合はどうなりますか?ドキュメントを取得するためにどのメソッドを呼び出すことができますか?
サンプルコード
Document doc = null;
try {
doc = Jsoup.connect(url).userAgent("Mozilla").get();
} catch (IOException e) {
e.printStackTrace();
}
System.out.println(doc.baseUri());