1

私のブラウザがアクセスできる Web ページがありますが、 urllib2.urlopen()(Python) とwget両方とも HTTP 403 (禁止) を返します。何が起こったのかを把握する方法はありますか?

のような最も原始的な形式をurllib2.urlopen("http://test.com/test.php")使用しており、ブラウザとwget. テストの前にブラウザのすべての Cookie をクリアしました。

どうもありがとう!

4

2 に答える 2

2

Pythonライブラリurllibには、Pythonという単語を含むデフォルトのユーザーエージェント文字列があり、wgetは「wget/VERSION」を使用します。cionnectiingしているサイトがユーザーエージェント情報をチェックする場合、おそらくこれら2つを拒否します。たとえば、Googleはそうします。

修正は簡単です。wgetの場合は-Uパラメーターを使用し、urllibの場合は適切な文字列を使用してURLOpenerを作成します。

于 2012-12-03T14:16:37.870 に答える