python - Python3.3を使用してブロックされたWebページにアクセスする

Question

インターネットからウェブページをダウンロードしようとしています。（URLlibを使用して）HTMLを盗むことはできますが、画像を正しくダウンロードできません。しかし、それについてはすでに質問があります。私の質問は、Pythonを使用してファイアウォールをバイパスして「ブロックされた」Webページにアクセスする方法はありますか？

理想的には、あいまいなコードまたはモジュールを使用することですが、それが不可能な場合は、別の方法（プロキシなど）を使用した適切な回避策を教えてもらえますか？

score 1 · Accepted Answer

HTMLページから画像を抽出する場合は、 reモジュールで解析する必要があります

import re

正規表現を使用してimgsrcタグのみを抽出します。すでに書かれたパーサーを使用することもできます。たとえば、BeautifulSoup> http://www.crummy.com/software/BeautifulSoup/

ファイアウォールは、コンピュータネットワークへの境界防御のパッシブコンポーネントであり、ネットワークの2つ以上のセクション間の連絡先としても機能し、ネットワーク自体のセキュリティの観点から保護を保証します。したがって、コード言語ではなく、ネットワークで直接作業する必要があります。

python - Python3.3を使用してブロックされたWebページにアクセスする

1 に答える 1

Related

Reference