0

私は何百万ものURLを持つファイルを持っています:データファイルは次のようなものです:

http://wonderland.cjfallon.ie/
http://www.youtube.com/
http://www.starfall.com/
http://education.scholastic.co.uk/
http://www.scoilnet.ie/
http://www.nessy.com/
http://www.senteacher.org/
http://scoop.it/
http://www.moviemaker.com/
http://learni.st/
http://www.twitter.com/
http://www.facebook.com/
http://www.gutenberg.org/
http://www.gutenberg.org/cache/epub/42361/pg42361.txt

それらをクロールしたいので、バウンドはネットワークIOなので、複数のスレッドまたはgeventを使用してそれに取り組みたいです。

私の複数のスレッドコードは、 https://gist.github.com/young001/5449751でうまく機能し ます

しかし、gevent を使用する場合、コードは次のとおりです : https://gist.github.com/young001/baa3eebbf7342c5ac077

status is 200
status is 200
Internal error in evhttp
the url is down http://web2.socialcomputingmagazine.com/the_social_graph_issues_and_strategies_in_2008.htm

the reason 
status is 200
status is 200
status is 200
status is 200
status is 200
status is 200
status is 301
status is 200
status is 301
status is 200
status is 200
Internal error in evhttp

そしてそれは行き詰まりました。よくわからんけどなんでこんな出てくるの?

助けはありますか?

すべてうまくいくはずなのに、そうじゃなくて気が狂ってしまう。

4

1 に答える 1