フォーラム用のスパイダーを書いています。セクションのいくつかのページを再帰的にクロールしようとしています。そこで、以下のルールを設定しました。
rules = (
Rule (SgmlLinkExtractor(allow=('&order=desc&page=\d'),restrict_xpaths=("//td[@class='navpage']/a"))
,callback='parse_items', follow= True),)
スパイダーが限られた数のページをクロールできるように、ページ制限を設定することは可能ですか? たとえば、1 ページから 8 ページまでクロールします。