Scrapyフレームワークを使用して作成したスパイダーがあります。パイプラインを機能させるのに問題があります。私のpipelines.pyには次のコードがあります。
class FilePipeline(object):
def __init__(self):
self.file = open('items.txt', 'wb')
def process_item(self, item, spider):
line = item['title'] + '\n'
self.file.write(line)
return item
私のCrawlSpiderサブクラスには、このクラスのパイプラインをアクティブ化するためのこの行があります。
ITEM_PIPELINES = [
'event.pipelines.FilePipeline'
]
しかし、私がそれを使用して実行すると
scrapy crawl my_spider
私は言う行を取得します
2010-11-03 20:24:06+0000 [scrapy] DEBUG: Enabled item pipelines:
パイプラインなし(これは、ロギングがパイプラインを出力する場所であると思います)。
ドキュメントを調べてみましたが、何かを見逃していないかどうかを確認するためのプロジェクト全体の完全な例はないようです。
次に何を試すべきかについての提案はありますか?またはどこでさらなるドキュメントを探すべきですか?