41

行が重複しているDataFrameがあります。一意のインデックスがあり、重複がないDataFrameを取得したいと思います。重複した値を破棄してもかまいません。これは可能ですか?それはによって行われるgroupbyでしょうか?

4

2 に答える 2

78
In [29]: df.drop_duplicates()
Out[29]: 
   b  c
1  2  3
3  4  0
7  5  9
于 2012-09-07T18:37:39.740 に答える
11

split-apply-combineのドキュメントの例を読んで、それを行う1つの方法を見つけました。

df = pandas.DataFrame({'b':[2,2,4,5], 'c': [3,3,0,9]}, index=[1,1,3,7])
df_unique = df.groupby(level=0).first()

df
   b  c
1  2  3
1  2  3
3  4  0
7  5  9

df_unique
   b  c
1  2  3
3  4  0
7  5  9
于 2012-09-07T17:38:49.223 に答える