さまざまなサイトに関連する 5 つのテキスト ファイルを含むフォルダがあります--
したがって、基本的にファイル名は- (サイト名).(サイト番号).(WRFc36).(いくつかの変数).(2000-2050.txt)の形式に従います。
これらの各テキスト ファイルには、同様の形式があり、ヘッダー行はありません: Year Month Day Value (各テキスト ファイルに ~18500 行で構成)
Python で同様のファイル名 (サイト名とサイト番号が一致する場所) を検索し、ファイルの 1 つからデータの 1 列目から 3 列目を選択して、新しい txt ファイルに貼り付けます。また、サイト (雨など) の各変数から 4 番目の列をコピーして貼り付け、新しいファイルに特定の順序で貼り付けたいと考えています。
使用したい出力は、サイトごとに 1 つのテキスト ファイル (5 ではない) で、次の形式 (年、月、日、変数 1、変数 2、変数 3、変数 4、変数 5) で、約 18500 行...
コレクションから import defaultdict import glob import csv
#Create dictionary of lists-- [A] = [Afilename1, Afilename2, Afilename3...]
# [B] = [Bfilename1, Bfilename2, Bfilename3...]
def get_site_files():
sites = defaultdict(list)
#to start, I have a bunch of files in this format ---
#"site name(unique)"."site num(unique)"."WRFc36"."Variable(5 for each site name)"."2000-2050"
for fname in glob.glob("*.txt"):
#split name at every instance of "."
parts = fname.split(".")
#check to make sure i only use the proper files-- having 6 parts to name and having WRFc36 as 3rd part
if len(parts)==6 and parts[2]=='WRFc36':
#Make sure site name is the full unique identifier, the first and second "parts"
return sites
#hardcode the variables for method 2, below
def main():
for site_name, files in get_site_files().iteritems():
print "Working on *****"+site_name+"*****"
####Method 1- I'd like to not hardcode in my variables (as in method 2), so I can use this script in other applications.
for filename in files:
reader = csv.reader(open(filename, "rb"))
WriteFile = csv.writer(open("XX_"+site_name+"_combined.txt","wb"))
for row in reader:
row = reader.next()
####Method 2 works (mostly), but skips a LOT of random lines of first file, and doesn't utilize the functionality built into my dictionary of lists...
## reader0 = csv.reader(open(site_name+".WRFc36."+Var[0]+".2000-2050.txt", "rb")) #I'd like to copy ALL columns from the first file
## reader1 = csv.reader(open(site_name+".WRFc36."+Var[1]+".2000-2050.txt", "rb")) # and just the fourth column from all the rest of the files
## reader2 = csv.reader(open(site_name+".WRFc36."+Var[2]+".2000-2050.txt", "rb")) # (the columns 1-3 are the same for all files)
## reader3 = csv.reader(open(site_name+".WRFc36."+Var[3]+".2000-2050.txt", "rb"))
## reader4 = csv.reader(open(site_name+".WRFc36."+Var[4]+".2000-2050.txt", "rb"))
## WriteFile = csv.writer(open("XX_"+site_name+"_COMBINED.txt", "wb")) #creates new command to write a text file
## for row in reader0:
## row = reader0.next()
## row1 = reader1.next()
## row2 = reader2.next()
## row3 = reader3.next()
## row4 = reader4.next()
## WriteFile.writerow(row + row1 + row2 + row3 + row4)
## print "***finished with site***"
if __name__=="__main__":