1

私のスパイダーは現在、Web サイトから xml をスクレイピングしています。データベース パイプラインを介してアイテムが格納されていることがわかるので、これは成功です。

しかし、ログ ( に設定log.INFO) を見ると、何もクロールされていないことが示されています。

2013-04-12 11:58:00-0400 [traffics] INFO: Spider opened
2013-04-12 11:58:00-0400 [traffics] INFO: Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)
2013-04-12 11:58:03-0400 [traffics] INFO: Closing spider (finished)
2013-04-12 11:58:03-0400 [traffics] INFO: Dumping Scrapy stats:
    {'downloader/request_bytes': 273,
     'downloader/request_count': 1,
     'downloader/request_method_count/GET': 1,
     'downloader/response_bytes': 28883,
     'downloader/response_count': 1,
     'downloader/response_status_count/200': 1,
     'finish_reason': 'finished',
     'finish_time': datetime.datetime(2013, 4, 12, 15, 58, 3, 469842),
     'log_count/DEBUG': 7,
     'log_count/INFO': 4,
     'response_received_count': 1,
     'scheduler/dequeued': 1,
     'scheduler/dequeued/memory': 1,
     'scheduler/enqueued': 1,
     'scheduler/enqueued/memory': 1,
     'start_time': datetime.datetime(2013, 4, 12, 15, 58, 0, 907300)}
2013-04-12 11:58:03-0400 [traffics] INFO: Spider closed (finished)

確実にクロールしている (そして、それらをデータベースに保存している) のに、0 個のアイテムと 0 ページがクロールされたと表示されるのはなぜですか?

4

1 に答える 1

1

データベース パイプラインの process_item メソッドは、アイテムが格納された後にアイテムを返していますか?

于 2013-04-18T17:36:51.637 に答える