このページからリンクを取得しようとしています: http://www.seas.harvard.edu/academics/areas
ページの中ほどに「Computer Science」というリンクがあります。その基礎となるリンクは「/academics/areas/computer-science」として与えられます。Java 組み込み URL クラスを使用して絶対 URL に変換し、「http://www.seas.harvard.edu/academics/areas/computer-science」を取得できます。
しかし、Chrome ブラウザでリンクをクリックすると、絶対 URL が「http://www.seas.harvard.edu/computer-science」に変わります。
だから私の質問は2つあります:
- このページで URL リダイレクトはどのように機能しますか?
- リダイレクト後に URL を取得するのに役立つ Java のライブラリまたはメソッドはありますか?
ページのソースコードを読みたいのでリダイレクト後のURLを取得する必要があるのですが、リダイレクト前のURLがうまくいきません。ライブラリを使用しJSoup
て URL から読み取っているので、javascript ベースのリダイレクトであると思われます。