次のサンプル データ フレームをサブセット化して、各 ID の最も早い発生 [つまり、min(年)] に対して 1 つの観測のみを返すにはどうすればよいですか?
id <- c("A", "A", "C", "D", "E", "F")
year <- c(2000, 2001, 2001, 2002, 2003, 2004)
qty <- c(100, 300, 100, 200, 100, 500)
df=data.frame(year, qty, id)
上記の例では、2000 年と 2001 年の "A" id の 2 つの観測があります。ID が重複している場合、サブセット データ フレームには、観測の最初の発生 (つまり 2000 年) のみを含めたいと思います。重複した ID。
df2 = subset(df, ???)
これは私が返そうとしているものです:
df2
year qty id
2000 100 A
2001 100 C
2002 200 D
2003 100 E
2004 500 F
どんな援助でも大歓迎です。