現在、csvファイルを1つに結合し、同様の列を複製しないプログラムを作成しています。作成された列は、隣接する列の次に追加する必要があります。
現在、ファイルを取得することはできますが、読み取ったcsvごとにデータフレームを反復処理し、これらのデータフレームをすべてマージしてcsvファイルをプッシュする方法を開発する方法を決定できません。現在、共通の ID 列を持つ 3 つの csv ファイルでこれをテストしています。現在持っているものは次のとおりです。
os.chdir(filedname)
data = pd.merge([pd.DataFrame.from_csv(file) for
file in glob.glob("*.csv")],on='ID')
data.to_csv('merged.csv')
ファイルは次のようになります。
(File 1) (File 2)
ID BLA ID X
1 2 1 55
2 3 2 2
3 4 3 12
4 5 4 52
また、ディレクトリ内の各 csv ファイルの ID 列以外の各列を互いにマージして、次のような 1 つの csv ファイルを作成する必要があります。
ID BLA X
1 2 55
2 3 2
3 4 12
4 5 52
この問題を解決するのに役立つアドバイスは素晴らしいでしょう。