24 列の約 30,000 行のデータを含む CSV ファイルがあります。最後の列は地理的な列で、次のようになります。
Ethiopia
IL
IL
TX
TX
MD
NY
NY
Ethiopia
Ethiopia
Sweden
CA
CA
HI
Latvia
OH
今のところ、すべての行を含む CSV 全体が、2 文字の州の略語 (CA、HI、OH など) である米国の地理的な場所に対応するようにしたいだけです。
基本的に、CSV 内のすべてのデータから、米国に関連しないものをすべて削除するか、可能であれば、最初の X 行を米国に拠点を置く場所ごとに配置し、残りを CSV の最後にあるすべてのものに配置したいと考えています。
これまでの私のコードは次のとおりです。
import csv
ask = "Y"
while ask != "N":
inputfile = input("Please enter filename: ")
filename = open(inputfile, "r")
data = []
with filename as f:
reader = csv.reader(f, delimiter=',')
for row in reader:
if len(row[24]) == 3:
data = row[24]
datalist = row[0:23].join(data)
output = open("Newly Created Data.csv","w")
output.write(datalist)
print ("Done.")
output.close()
ask = input("Another file, Y or N? ")
米国の場所のみを読み取ることで、列 24 のデータを正しく配置しますが、残りのファイルと他の 23 列を並べ替えて、米国の場所のみと一致させる方法がわかりません。
私はPython 3を使用しています、ありがとう。