0

圧縮された多くのファイルが与えられましたが、解凍されたファイルは 30 GB 以上で、Windows で圧縮されています。これらを解凍するために EC2 インスタンスを使用してシステムを作成しようとしていますが、メモリを使い果たし続けています (エラーIOError: [Errno 28] No space left on device)。私の解凍スクリプトは次のとおりです。

import boto3
from boto3.s3.transfer import S3Transfer
from zipfile import ZipFile as zip
import ec2metadata
import re

s3 = boto3.client('s3')
transfer = S3Transfer(s3)


def get_info():
    userdata = re.findall(r"\=(.*?) ", ec2metadata.get('user-data'))
    global dump_bucket 
    dump_bucket = userdata[0]
    global bucket
    bucket = userdata[1]
    global key
    key = userdata[2]
    return dump_bucket, bucket, key

def unzipper(origin_bucket, origin_file, dest_bucket):
    s3.download_file(bucket, key, '/tmp/file.zip')

    zfile = zip('/tmp/file.zip')

    namelist = zfile.namelist()

    for filename in namelist:
        data = zfile.read(filename)
        f = open('/tmp/' + str(filename), 'wb')
        f.write(data)
        f.close()

    transfer.upload_file('/tmp/' + str(filename), dump_bucket, namelist[0])

def main():
    get_info()
    unzipper(dump_bucket, bucket, key)

main()

ファイルを解凍するより良い方法はありますか? ストリーミングしてみましたが、おそらく最初の圧縮方法が原因でうまくいきませんでした。

4

1 に答える 1

0

使用可能なメモリを増やすことでこれを解決できました。問題の一部はエンコーディングにも起因していました。そのため、デフォルトのエンコーディングをlatin-1に変更する必要がありました

于 2015-11-13T20:13:27.160 に答える