PythonでTorを介してWebページにアクセスする方法を知りたいです。
同様の質問がいくつかありますが、それらのどれも完全に答えられておらず、多くの答えが完全に間違っています。
私が偶然見つけた最初のページはこれでした。PythonでTorを介してurllib2リクエストを行う方法は?、そしてそこにある最も人気のある答えは;
proxy_support = urllib2.ProxyHandler({"http" : "127.0.0.1:8118"})
opener = urllib2.build_opener(proxy_support)
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
print opener.open('http://www.google.com').read()
似たような答えのページがいくつかありますが、とにかくそのページの誰かがコメントしました。
「このスレッドを読んでいる人にとって、ポート8118が実際にはTorではなくPrivoxyのポートであることを知っておく価値があるかもしれません。Torは厳密にSOCKSのみのプロキシ(ポート9050)であるため、SOCKS以外のすべてのトラフィック(HTTPなど)を拒否します。非SOCKSトラフィックの場合、Torが受け入れるようにトラフィックをSOCKSに変換するには、Privoxy(ポート8118)またはPolipo(ポート8123)を使用する必要があります。
Privoxyはプライバシーに優れており、Polipoはキャッシュを行うため、パフォーマンスに優れています。」
だから、これは私をどこにも連れて行かないでしょう、いくつかの検索の後、私はTOR上でこのPythonurllibを見つけましたか?
socksipyをダウンロードして、コードを試しました。それは動作しますが、私はこの男と同じエラーが発生します。彼の問題に対する受け入れられた答えはありません。投稿は2011年からですが、明確にしようとする新しい質問が正しいと思いました。
あるいは、Torを扱うための良いライブラリはありますか?