http://doc.scrapy.org/en/0.22/topics/jobs.htmlで説明されているように Spider.state を使用しようとしましたが、エラーが発生しました
MyCrawlSpider has no attribute 'state'
CrawlSpider 派生クラスのinit () 関数で使用しようとしています。これが問題でしょうか?
class MyCrawlSpider(CrawlSpider):
crawl_start = datetime.utcnow().isoformat()
def __init__(self, *args, **kwargs):
super(MyCrawlSpider, self).__init__(*args, **kwargs)
if self.state.get('crawl_start'):
crawl_start = self.state.get('crawl_start')
else:
self.state["crawl_start"] = crawl_start
私の目標は、クローラーが最初に開始されたアイソフォーマットの日時文字列に常にクロール開始属性を設定することです。