コマンドラインから完全に実行されるスパイダーを次のようにセットアップしました
$ scrapy crawl somesite
そして、この文字列でシェルスクリプトを作成し、cronjob で実行しました。しかし、クロールは前のスクレイピー クローラーの終了を待たないため、非常に悪い考えです。だから私はいくつかの非常に厄介な結果を得ました。だから私はクローラーを実行しようとしています
$ scrapy server
$ curl http://localhost:6800/schedule.json -d project=myproject -d spider=spider2
そして結果が出ない。クローラが実行されていません。スパイダーの実行をスケジュールする方法がわかりません (たとえば、10 分ごと)。