Webサイトからいくつかのデータをクロールするスパイダーを作成する必要があります。データの一部は外部URLです。
ルートサイトからデータをクロールするスパイダーを既に作成しました。次に、外部Webページ用のスパイダーを作成します。
SgmlLinkExtractorを使用して各外部Webページの特定のリンクをたどるクロールスパイダーを作成することを考えていました。
start_urlのリストを2番目のスパイダーに伝達するための推奨される方法は何ですか?
私のアイデアは、アイテムのjsonファイルを生成し、2番目のスパイダーのstart_requestsの属性を読み取ることです。