1

spider引数として取るという名前の関数がありseedます。seedスパイダー関数に送信する URL の名前です。ここで私の質問は、Python で beanstalkc を使用して URL をキューに入れ、ジョブを実行する方法です。

4

1 に答える 1

1

チュートリアルによると、次のものが必要になります。

  1. beanstalkd サーバーが実行されています。
  2. 接続:

    import beanstalkc
    beanstalk = beanstalkc.Connection(host='localhost', port=14711)
    
  3. 次を使用してジョブを追加します。

    beanstalk.put('seed url')
    
  4. 次の方法で仕事を得る:

    job = beanstalk.reserve()
    spider(job.body)
    
  5. ジョブを完了としてマーク:

    job.delete()
    
于 2011-06-27T08:45:45.357 に答える