インターネットからウェブページをダウンロードしようとしています。(URLlibを使用して)HTMLを盗むことはできますが、画像を正しくダウンロードできません。しかし、それについてはすでに質問があります。私の質問は、Pythonを使用してファイアウォールをバイパスして「ブロックされた」Webページにアクセスする方法はありますか?
理想的には、あいまいなコードまたはモジュールを使用することですが、それが不可能な場合は、別の方法(プロキシなど)を使用した適切な回避策を教えてもらえますか?
インターネットからウェブページをダウンロードしようとしています。(URLlibを使用して)HTMLを盗むことはできますが、画像を正しくダウンロードできません。しかし、それについてはすでに質問があります。私の質問は、Pythonを使用してファイアウォールをバイパスして「ブロックされた」Webページにアクセスする方法はありますか?
理想的には、あいまいなコードまたはモジュールを使用することですが、それが不可能な場合は、別の方法(プロキシなど)を使用した適切な回避策を教えてもらえますか?
HTMLページから画像を抽出する場合は、 reモジュールで解析する必要があります
import re
正規表現を使用してimgsrcタグのみを抽出します。すでに書かれたパーサーを使用することもできます。たとえば、BeautifulSoup> http://www.crummy.com/software/BeautifulSoup/
ファイアウォールは、コンピュータネットワークへの境界防御のパッシブコンポーネントであり、ネットワークの2つ以上のセクション間の連絡先としても機能し、ネットワーク自体のセキュリティの観点から保護を保証します。したがって、コード言語ではなく、ネットワークで直接作業する必要があります。