サイト www.idea.int の /publications/ フォルダーだけをダウンロードして、オフラインで表示するために USB ドライブに含めようとしています。
私が試してみました:
wget --recursive --no-remove-listing -l inf --no-parent --adjust-extension
--no-cookies --convert-links --page-requisites http://www.idea.int/publications/
/publications/ とサブフォルダーのみを正しく保存します。しかし、これらのページには static0.idea.int から取得された画像があり、これらはダウンロードも再リンクもされていません。それでも--page-requisites
フラグがオンになっています。
それで、私は試しました:
wget --recursive --no-remove-listing -l inf --no-parent --adjust-extension
--no-cookies --convert-links --page-requisites
--span-hosts --domains=idea.int http://offline.idea.int/publications/
--span-hosts
これにより、ステップで画像をダウンロードして再リンクできるようになることを願っていますconvert-links
。ただし、これは--no-parent
オプションを無視し、基本的に www.idea.int サイト全体をダウンロードします。
/publications/ 内のすべての HTML ページと、それらのページに含まれるすべての画像リソース (別のドメインであっても) をダウンロードし、オフラインで表示できるように再リンクする方法はありますか?