R で複製された関数は、重複行検索を実行します。重複を削除したい場合は、書き込むだけdf[!duplicated(df),]
で重複がデータ フレームから削除されます。
しかし、重複データのインデックスを見つける方法は? ある行で TRUE を返す場合duplicated
、これはデータ フレーム内でそのような行が 2 番目に発生したことを意味し、そのインデックスは簡単に取得できます。この行の最初の出現のインデックスを取得する方法は? または、つまり、複製された行が同一であるインデックス?
data.frame でループを作成することもできますが、この質問にはもっとエレガントな答えがあると思います。