0

13列で約900000行のcsvファイルがあります.28445行まではすべて正常に動作しますが、その後はエラーが発生します

プログラミングエラー

例外値: 書式文字列の引数が不十分です

行を印刷して列に問題があるかどうかを確認しようとしましたが、やはり問題はないようです。

['INDIA', '5', '1ST TIME MOTHER', 'PATNA', 'A2', 'BRAND DRIVERS', '', '', '見つけにくい', '', '', '1' 、「0 ~ 12 か月」]

def upload(request):
    if request.method == 'POST':
        cursor = connection.cursor()
        query = ''' INSERT INTO johnson_jnjusage (country,no_of_people_house,nursing_cnt,city,sec,bucket,category1,category2, final_category, responders, usageFrequency, base, child_age_group) 
                    VALUES(%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s) '''
        x=[]
        reader = csv.reader(request.FILES['csvData'],delimiter=',')
        i = 0
        for row in reader:
            x.append(tuple(row))
            if i>=5000:
                cursor.executemany(query,tuple(x))
                transaction.commit()
                x=[]
                i=0

            i = i+1

        cursor.close()
        return HttpResponse( docfile.name + "'s data inserted into database successfully")

皆さんがこれで私を助けてくれるなら、事前に感謝します

4

3 に答える 3

0

わかった。行のサイズを確認してから、その特定の行をエスケープしました。また、「\ x00」などの文字を取得していたので、正規表現を使用してそれらを削除しました。

def upload(request):
    start_time = time.time()
    print start_time
    if request.method == 'POST':
        cursor = connection.cursor()    
        x=[]
        docfile = request.FILES['csvData']

        reader = csv.reader(request.FILES['csvData'],delimiter=',')

        to_create = []
        for i, row in enumerate(reader):
            if len(row) != 13:
                reader.next()
                continue

            j = JnJUsage()
            j.country =row[0]
            j.no_of_people_house = row[1]
            j.nursing_cnt = row[2]
            j.city = row[3]
            j.sec = row[4]
            j.bucket = row[5]
            j.category1 = row[6]
            j.category2 = row[7]
            j.final_category = re.sub(r'[\x00-\x08\x0b\x0c\x0e-\x1f\x7f-\xff]', '', row[8])
            j.responders = row[9]
            j.usageFrequency = row[10]
            j.base = row[11]
            j.child_age_group = row[12]

            to_create.append(j)

            # If 900k is too much then you could consider something like this
            if i % 10000 == 0:
                JnJUsage.objects.bulk_create(to_create)
                to_create = []
        JnJUsage.objects.bulk_create(to_create)

        return HttpResponse( docfile.name + "'s data inserted into database successfully")

助けてくれたドミトリー・ミハイロフとナサニエルに感謝

于 2014-08-07T13:14:55.083 に答える
0

もちろん、bulk_create を使用できます。次のようになります。

def upload(request):
    if request.method == 'POST':
        cursor = connection.cursor()
        x=[]
        reader = csv.reader(request.FILES['csvData'],delimiter=',')
        i = 0
        for row in reader:
            obj = new MyObject()
            obj.country = row[0]
            obj.city = row[3]
            ...
            x.append(obj)
            if i>=5000:
                MyObject.objects.bulk_create(x)
                x=[]
                i=0

            i = i+1
        return HttpResponse( docfile.name + "'s data inserted into database successfully")

docsで詳細情報を見つけることができbulk_createます。

于 2014-08-07T12:08:45.457 に答える