0

wget を使用して、過去 30 分間に変更された ZIP ファイルをダウンロードします。zipファイルにはcsvファイルがあります。Zip ファイルに新しい csv ファイルが含まれているか、既にダウンロードしたファイルが変更されているか、特定のファイルが変更されていない可能性があります。これらの変更されたファイル/新しいファイルを zip ファイルから選択し、データベースにロードする必要があります。何かお勧めがあれば教えてください。

4

1 に答える 1

1

アーカイブメンバーのCRCを取得し、CRCで比較できます

import zipfile
z = zipfile.ZipFile('d:\\temp\\debug.zip')
for member_info in z.infolist():
    print member_info.orig_filename, member_info.CRC

例 (名前、CRC):

 tfr/products/tests/11/data/1000sites 1458294800
 tfr/products/tests/11/data/100sites 1275729396
 tfr/products/tests/11/data/list_of_2.txt 677585194
 tfr/products/tests/11/data/list_of_1.txt 0
于 2012-10-24T14:20:58.840 に答える