Scrapyはファイルを正しくダウンロードしていません。アイテムのURLを持っているので、wgetを使用してファイルをダウンロードできると思いました。
Scrapyprocess_item
関数内でwgetを使用するにはどうすればよいですか?または、ファイルをダウンロードする別の方法はありますか?
class MyImagesPipeline(ImagesPipeline):
#Name download version
def image_key(self, url):
image_guid = url.split('/')[-1]
return 'full/%s' % (image_guid)
def get_media_requests(self, item, info):
if item['image_urls']:
for image_url in item['image_urls']:
# wget -nH image_ul -P images/
yield Request(image_url)