0

someExampleSite.com の 12 ページを 3 分ごとに ping する python スクリプトがあります。数か月間動作していますが、今日、実行するたびに 6 ページで 404 エラーが発生し始めました。

そこで、スクリプトが実行されている PC の URL にアクセスしてみましたが、Chrome と Safari で問題なく読み込まれました。また、スクリプトが使用しているユーザー エージェント文字列を変更しようとしましたが、何も変更されませんでした。また、何も変更しなかった ['If-Modified-Since'] ヘッダーを削除しようとしました。

サーバーがこれらの 6 ページに対してスクリプトに 404 を送信するのに、同じコンピューターで Chrome と Safari に問題なくロードできるのはなぜですか? (Chrome と Safari でハード リフレッシュを行ったが、まだ読み込まれていることを確認しました)

urllib2 を使用してリクエストを作成しています。

4

2 に答える 2

1

これには複数の理由が考えられます。たとえば、サーバーがヘッダーの欠落やスロットリングに基づいてリクエストを拒否しているなどです。

HTTPヘッダーを使用してクロムでリクエストヘッダーを記録してから、 Pythonリクエストライブラリを使用して、リクエストにすべてのブラウザーヘッダーを追加することができます。次に、ヘッダーを変更または削除して、正確に何が起こっているかを確認できます。

于 2013-05-02T15:11:32.167 に答える