python urlib のようなものを使用して、ウェブサイト全体をダウンロードする必要があります
import urllib
site = urllib.urlopen('http://www.mathrubumi.com/index.php')
site_data = site.read()
最初のページのみをダウンロードします。それが index.php です。Web サイト全体をダウンロードするコードを作成するにはどうすればよいですか。ループすることで?? または他の方法はありますか?たとえばwget
、コードではループは必要ありません
wget \ --recursive \--no-clobber \ --page-requisites \ --html-extension \ --convert-links \
--restrict-file-names=windows \ --domains website.org \ --no-parent \ www.website.org/tutorials/html/