1

重複の可能性:
Pythonでファイルをダウンロードする方法

私はいくつかのクロール作業を行うためにPythonで遊んでいます。urllib.urlopen("http://XXXX")ターゲットWebサイトのhtmlを取得するのに役立つことがあることを私は知っています。ただし、そのWebページの元の画像へのリンクにより、通常、バックアップページの画像は使用できなくなります。ローカルスペースに画像を保存して、インターネットに接続しなくてもWebサイトのコンテンツ全体を読むことができる方法があるのではないかと思います。Webページ全体をバックアップするようなものですが、Pythonでそれを行う方法があるかどうかはわかりません。また、それが広告のものを取り除くことができれば、それはもっと素晴らしいでしょう。ありがとう。

4

1 に答える 1

1

単一のWebページのバックアップを検討している場合は、順調に進んでいます。

クロールについて言及しているので、Webサイト全体をバックアップする場合は、実際のクロールを実行する必要があり、そのためにはスクレイプが必要になります。

インターウェブからファイルをダウンロードする方法はいくつかあります。次の質問を参照してください。

  1. Pythonファイルのダウンロード
  2. 方法-Pythonでファイルをダウンロードする
  3. Pythonを使用してhttpからファイルのダウンロードを自動化する

お役に立てれば

于 2012-09-30T20:16:57.013 に答える