Javaを使用してベースURLを取得しようとしています。コードでjtidyパーサーを使用してタイトルを取得しました。jtidyを使用してタイトルを正しく取得していますが、指定されたURLからベースURLを取得していません。
入力としていくつかのURLがあります:
String s1 = "http://staff.unak.is/andy/GameProgramming0910/new_page_2.htm";
String s2 = "http://www.complex.com/pop-culture/2011/04/10-hottest-women-in-fast-and-furious-movies";
最初の文字列からベースURLとしてフェッチ"http://staff.unak.is/andy/GameProgramming0910/"
し、2番目の文字列からベースURLとしてフェッチし"http://www.complex.com/"
ます。
私はコードを使用しています:
URL url = new URL(s1);
HttpURLConnection conn = (HttpURLConnection) url.openConnection();
InputStream in = conn.getInputStream();
Document doc = new Tidy().parseDOM(in, null);
String titleText = doc.getElementsByTagName("title").item(0).getFirstChild()
.getNodeValue();
取得titletext
していますが、上記のURLからベースURLを取得する方法を教えてください。