0

http://avito.ruのページをアクティブにナビゲートすると、興味深い動作に直面しました。

そのため、私は非常に積極的にナビゲートし、2 ~ 3 秒ごとに 1 ページを開きました。1分後、空白の画面が表示されました(これが彼らの禁止の仕組みです。説明なしで、禁止の時間は約20分です)。LiveHeaders FF プラグインを使用して応答ヘッダーを確認しましたが、応答は 403 でした。

OK、Cookie を消去し、FF を再起動しましたが、応答 403 で空白の画面が表示されました。OK、Chrome を起動しましたが、まだ空白の画面です (追跡方法は Cookie/セッションではありません)そこに空白があります(わかりました、それで私はIPによって禁止されたのでしょうか?)

しかし、驚くべきことに、Java から実際のソース ページをダウンロードすることができました (HttpClient ライブラリを使用)。

これは 100% 再現性があり、一日中再生できます。

問題は、avito.ru が使用するトラッキング メカニズムは何ですか? 私は考えていました:SSL証明書ヘッダー(HTTPSページにリダイレクトします)、TCPヘッダー..

4

0 に答える 0