nydaily ニュースや他の Web サイトから htmltext を取得しようとしていますが、正しくタイムアウトするように機械化できません。タイムアウトが .01 の場合はすぐにタイムアウトしますが、タイムアウトがより妥当な値 (1.0) の場合は、次のエラーが発生するまで約 2 分間実行されます。
Exception in thread Thread-1:
Traceback (most recent call last):
File "/usr/lib/python2.7/threading.py", line 551, in __bootstrap_inner
self.run()
File "/usr/lib/python2.7/dist-packages/spyderlib/widgets/externalshell/monitor.py", line 575, in run
already_pickled=True)
File "/usr/lib/python2.7/dist-packages/spyderlib/utils/bsdsocket.py", line 24, in write_packet
sock.send(struct.pack("l", len(sent_data)) + sent_data)
error: [Errno 32] Broken pipe
import mechanize
br = mechanize.Browser()
url = 'http://www.nydailynews.com/services/feeds'
htmltext= br.open(url,timeout=1.0).read()
print htmltext[:200]