3

私はhtmlページを解析するためにpython lxmlライブラリを使用しています:

import lxml.html

# this might run indefinitely
page = lxml.html.parse('http://stackoverflow.com/')

解析のタイムアウトを設定する方法はありますか?

4

1 に答える 1

1

オープナーとして使用しているように見えますurllib.urlopenが、これを行う最も簡単な方法は、ソケット ハンドラーのデフォルトのタイムアウトを変更することです。

import socket
timeout = 10
socket.setdefaulttimeout(timeout)

もちろん、これは簡単な解決策です。

于 2010-05-05T02:55:57.823 に答える