3

サイト www.idea.int の /publications/ フォルダーだけをダウンロードして、オフラインで表示するために USB ドライブに含めようとしています。

私が試してみました:

wget --recursive --no-remove-listing -l inf --no-parent --adjust-extension 
 --no-cookies --convert-links --page-requisites http://www.idea.int/publications/ 

/publications/ とサブフォルダーのみを正しく保存します。しかし、これらのページには static0.idea.int から取得された画像があり、これらはダウンロードも再リンクもされていません。それでも--page-requisitesフラグがオンになっています。

それで、私は試しました:

wget --recursive --no-remove-listing -l inf --no-parent --adjust-extension 
   --no-cookies --convert-links --page-requisites   
   --span-hosts --domains=idea.int http://offline.idea.int/publications/

--span-hostsこれにより、ステップで画像をダウンロードして再リンクできるようになることを願っていますconvert-links。ただし、これは--no-parentオプションを無視し、基本的に www.idea.int サイト全体をダウンロードします。

/publications/ 内のすべての HTML ページと、それらのページに含まれるすべての画像リソース (別のドメインであっても) をダウンロードし、オフラインで表示できるように再リンクする方法はありますか?

4

1 に答える 1