53

Date と Taxa の 2 つの変数を持つデータ フレームがあり、各分類群が最初に発生した日付を取得したいと考えています。172 行で構成されるデータ フレームには 9 つの異なる日付と 40 の異なる分類群がありますが、私の答えには 40 行しかないはずです。

Taxa は因子で、Date は日付です。

たとえば、私のデータ フレーム (「種」と呼ばれる) は次のように設定されています。

Date          Taxa
2013-07-12    A
2011-08-31    B
2012-09-06    C
2012-05-17    A
2013-07-12    C
2012-09-07    B

そして、私は次のような答えを探しています:

Date          Taxa
2012-05-17    A
2011-08-31    B
2012-09-06    C

私は使用してみました:

t.first <-  species[unique(species$Taxa),]

正しい行数が得られましたが、タクサが繰り返されていました。unique(species$Taxa) だけを使用すると、正しい答えが得られるように見えますが、最初に発生した日付はわかりません。

助けてくれてありがとう。

4

5 に答える 5

16

次のコマンドでduplicatedは、重複するdata$Taxa値の論理インデックスを作成します。対応する行のないデータ フレームのサブセットは、次のように作成されます。

data[!duplicated(data$Taxa), ]

結果:

        Date Taxa
1 2012-05-17    A
2 2011-08-31    B
3 2012-09-06    C
于 2013-11-13T04:44:22.900 に答える