Webページのソースからリンクの絶対パスを見つけたい。
たとえば、Webページのソースには、次のような行があります。
href="lectures/lecture04.pdf"
しかし、これの絶対的な道は
www.abc.com/courses/cs101/lectures/lecture04.pdf
このパスをbashシェルで取得する方法はありますか?
試す:
$ wget --convert-links URL
wget
マニュアルから、スイッチ--convert-links
は次のように説明されています。
Wgetによってダウンロードされていないファイルへのリンクは、ホスト名とそれらが指す場所の絶対パスを含むように変更されます。
例:ダウンロードしたファイル/foo/doc.htmlが/bar/img.gif(または../bar/img.gif)にリンクしている場合、doc.htmlのリンクは。を指すように変更され
http://hostname/bar/img.gif
ます。