このコードは正常に動作し、html を読み取っていました。その後、サイトは read() に関するデータの提供を停止しました。エラーコードなし。
Webサーバーが何か異常を検出したからですよね?(ユーザー エージェントを設定する前に、エラー 403: Bad Behavior が発生しました)
urllib2 には、フラグを立てる顕著な署名がありますか? 別のライブラリに切り替えると役に立ちますか?
疑わしいことはしていません。このライブラリを使用してページを読み取る場合と、lynx ブラウザーを使用する場合の動作の違いはわかりません。
import urllib2
opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
search_url='http://www.google.com/?search=stackoverflow"'
raw = opener.open(search_url)
print raw.headers
print raw.read()