関数を書くときparse()
、1 つのページに対してリクエストとアイテムの両方を生成できますか?
ページ A でいくつかのデータを抽出し、そのデータをデータベースに保存して、たどるリンクを抽出したいと考えています (これは CrawlSpider のルールで実行できます)。
A ページのリンク ページを B ページと呼ぶので、別の parse_item() を記述して B ページからデータを抽出できますが、B ページのいくつかのリンクを抽出したいので、ルールを使用してリンクを抽出することしかできませんか? Scrapy で重複する URL に取り組む方法は?