spider
引数として取るという名前の関数がありseed
ます。seed
スパイダー関数に送信する URL の名前です。ここで私の質問は、Python で beanstalkc を使用して URL をキューに入れ、ジョブを実行する方法です。
質問する
2037 次
1 に答える
1
チュートリアルによると、次のものが必要になります。
- beanstalkd サーバーが実行されています。
接続:
import beanstalkc beanstalk = beanstalkc.Connection(host='localhost', port=14711)
次を使用してジョブを追加します。
beanstalk.put('seed url')
次の方法で仕事を得る:
job = beanstalk.reserve() spider(job.body)
ジョブを完了としてマーク:
job.delete()
于 2011-06-27T08:45:45.357 に答える