現在、スクレーパーはテキストだけでなく画像もダウンロードしています。現在の状態のスクレーパーは問題なく動作していますが、ダウンロードした画像の品質に大きな問題があります。標準の ImagePipeline を確認した後、Pillow に最高品質を使用するように指示するカスタム パイプラインを実装しました。これは次のようになります (settings.py で構成されます)。
from scrapy.contrib.pipeline.images import ImagesPipeline
from scrapy.exceptions import DropItem
from scrapy.http import Request
from cStringIO import StringIO
class CustomImagesPipeline(ImagesPipeline):
def convert_image(self, image, size=None):
buf = StringIO()
image.save(buf, 'JPEG', quality=100)
return image, buf
このファイルから取得した他のいくつかのプリセットも試しました: https://github.com/python-imaging/Pillow/blob/master/PIL/JpegPresets.py
しかし、改善は見られませんでした。ここで誰かが以前にこの問題に取り組んだことがありますか、またはコードの何が問題なのか考えていますか?
ありがとう :)