pandas
2 つの CSV ファイルを、ProjectID という列でインデックス付けされた 1 つのファイルに結合するために使用しています。これが完了すると、まだ多数の重複レコードがあります。私はこれらの最新のものだけを保持したいです(それらは日付が古いものから新しいものの順に並んでいます)。私がこれまでに持っているコードは次のとおりです。
merged_df = pandas.merge(df1, df2, on="ProjectID", how="left")
私が少し問題を抱えているのは、プロジェクトの複数のバージョンがある最後の行だけを保持する方法です。pandas
これに役立つものが組み込まれていますか?
サンプルデータを追加するために編集
現在のデータ
ProjectID Value Date
1 54 9/21/2010
2 32 10/22/2010
2 32 10/28/2010
3 76 9/21/2010
4 37 9/21/2010
4 37 11/12/2010
4 38 11/14/2010
欲しいデータ
ProjectID Value Date
1 54 9/21/2010
2 32 10/28/2010
3 76 9/21/2010
4 38 11/14/2010