8

Scrapyフレームワークを使用して作成したスパイダーがあります。パイプラインを機能させるのに問題があります。私のpipelines.pyには次のコードがあります。

class FilePipeline(object):

    def __init__(self):
        self.file = open('items.txt', 'wb')

    def process_item(self, item, spider):
        line = item['title'] + '\n'
        self.file.write(line)
        return item

私のCrawlSpiderサブクラスには、このクラスのパイプラインをアクティブ化するためのこの行があります。

ITEM_PIPELINES = [
        'event.pipelines.FilePipeline'
    ]

しかし、私がそれを使用して実行すると

scrapy crawl my_spider

私は言う行を取得します

2010-11-03 20:24:06+0000 [scrapy] DEBUG: Enabled item pipelines:

パイプラインなし(これは、ロギングがパイプラインを出力する場所であると思います)。

ドキュメントを調べてみましたが、何かを見逃していないかどうかを確認するためのプロジェクト全体の完全な例はないようです。

次に何を試すべきかについての提案はありますか?またはどこでさらなるドキュメントを探すべきですか?

4

2 に答える 2

8

とった!この行は、プロジェクトの設定モジュールに入れる必要があります。今それは動作します!

于 2010-11-04T20:17:59.263 に答える
0

私はそれがどこかの単語パイプラインの大文字の違いであることを確信しています:

パイプライン対パイプライン

私は前者を使用しているのに気づき'event.pipelines.FilePipeline'ましたが、あなたのコードは後者を使用しています:あなたのファイル名はどちらを使用していますか?

(私はこのスペルミスの犠牲になっています!)

于 2010-11-03T19:27:47.783 に答える