私は次のような状況にあります:次のようなdata.frameがあります:
Col1 Col2 a 3.4 a 3.4 d 3.2 c 3.2
次の出力が欲しいです:
Col1 Col2 a 3.4 d 3.2 c 3.2
つまり、「Col1」の値「a」は正確に複製されるため1回考慮されます。そうでない場合、「d」と「c」の値が「Col2」で報告された値と同じであっても、2回考慮されます。それらは異なるエンティティです(「d」は「c」とは異なります)
誰か助けてくれませんか?
私は次のような状況にあります:次のようなdata.frameがあります:
Col1 Col2 a 3.4 a 3.4 d 3.2 c 3.2
次の出力が欲しいです:
Col1 Col2 a 3.4 d 3.2 c 3.2
つまり、「Col1」の値「a」は正確に複製されるため1回考慮されます。そうでない場合、「d」と「c」の値が「Col2」で報告された値と同じであっても、2回考慮されます。それらは異なるエンティティです(「d」は「c」とは異なります)
誰か助けてくれませんか?
これを試して:
DF <- read.table(text=" Col1 Col2
a 3.4
a 3.4
d 3.2
c 3.2 ", header=T)
aggregate(Col2~Col1, unique, data=DF)
Col1 Col2
1 a 3.4
2 c 3.2
3 d 3.2
> df <- read.table(header=T, text='
+ label value
+ A 4
+ B 3
+ C 6
+ B 3
+ B 1
+ A 2
+ A 4
+ A 4
+ ')
> unique(df[duplicated(df),]) # Finds unique duplicated
label value
4 B 3
7 A 4
> df[duplicated(df),] # Finds Duplicated
label value
4 B 3
7 A 4
8 A 4
> df[!duplicated(df),] # Finds rows which are not duplicated
label value
1 A 4
2 B 3
3 C 6
5 B 1
6 A 2
>