私は非常に大きなデータセットを持っています、そしてそれは以下のように見えます:
df <- data.frame(school=c("a", "a", "a", "b","b","c","c","c"), year=c(3,3,1,4,2,4,3,1), GPA=c(4,4,4,3,3,3,2,2))
school year GPA
a 3 4
a 3 4
a 1 4
b 4 3
b 2 3
c 4 3
c 3 2
c 1 2
そして私はそれを次のように見せたい:
school year GPA
a 3 4
a 3 4
b 4 3
c 4 3
ですから、基本的には、GPAに関係なく、各学校に1年生(学生)が欲しいのです。
私が試してみました:
new_df <- df[!duplicated(paste(df[,1],df[,2])),]
しかし、これは私に学校と年の間のユニークな組み合わせを与えます。
下の学校は私にユニークな学校を与えてくれます
new_df2 <- df[!duplicated(df$school),]