1

この単純なコードをインターネットに到達させようとしています。私はプロキシ サーバーの背後にいますが、http_proxy、https_proxy、および no_proxy 環境変数を設定しました。

Python コード:

from selenium import webdriver
driver = webdriver.PhantomJS()
driver.get('http://www.google.com')
driver.page_source

出力:

u'<html><head><title> Web Authentication Redirect</title><meta http-equiv="Cache-control" content="no-cache"><meta http-equiv="Pragma" content="no-cache"><meta http-equiv="Expires" content="-1"><meta http-equiv="refresh" content="1; URL=https://1.1.1.1/login.html?redirect=www.google.com/"></head><body>\n</body></html>'

これを回避する方法についてのアイデアはありますか?

また、Ubuntu 12.04 LTS を使用しています。

4

2 に答える 2

0

それがあなたがページに着地したページであり、それがあなたをリダイレクトする場合(別名、待機中の問題)、試してみることができますwait.until(ExpectedConditions.titleIs("Google"))

注: これは Java コードですが、変換するのはそれほど難しくありません。 waitのインスタンスですWebDriverWait

于 2013-08-06T15:12:02.463 に答える
0

ネットワーク上の何かが自動的に読み込まれ、目的の場所に即座にリダイレクトされるように見えます。ページのソースを取得する前に、リダイレクトに従うだけでよいと思います。

Selenium がリダイレクトに従うまで待機する場合は、Web サイトで JavaScript リダイレクトの最終的な宛先を取得するを参照してください。

于 2013-08-06T15:23:32.737 に答える