python - ウェブページ全体をバックアップする方法は、Pythonで画像を含めますか？

Question

重複の可能性：
Pythonでファイルをダウンロードする方法

私はいくつかのクロール作業を行うためにPythonで遊んでいます。urllib.urlopen("http://XXXX")ターゲットWebサイトのhtmlを取得するのに役立つことがあることを私は知っています。ただし、そのWebページの元の画像へのリンクにより、通常、バックアップページの画像は使用できなくなります。ローカルスペースに画像を保存して、インターネットに接続しなくてもWebサイトのコンテンツ全体を読むことができる方法があるのではないかと思います。Webページ全体をバックアップするようなものですが、Pythonでそれを行う方法があるかどうかはわかりません。また、それが広告のものを取り除くことができれば、それはもっと素晴らしいでしょう。ありがとう。

score 1 · Accepted Answer

単一のWebページのバックアップを検討している場合は、順調に進んでいます。

クロールについて言及しているので、Webサイト全体をバックアップする場合は、実際のクロールを実行する必要があり、そのためにはスクレイプが必要になります。

インターウェブからファイルをダウンロードする方法はいくつかあります。次の質問を参照してください。

お役に立てれば

python - ウェブページ全体をバックアップする方法は、Pythonで画像を含めますか？

1 に答える 1

Related

Reference