ID.A、ID.B、および DISTANCE 列を含む R のデータフレームがあります。ここで、距離は ID.A と ID.B の間の距離を表します。ID.A の各値 (1->n) に対して、ID.B と DISTANCE の複数の値が存在する場合があります (つまり、ID.A に複数の重複行が存在する場合があります。たとえば、それぞれが異なる ID.B を持つ値 4 のすべて)。とその行の距離)。
ID.A が重複している行を削除できるようにしたいと考えていますが、ID.A レコードごとに最小の距離値が残るように距離値を条件としています。
うまくいけば、それは理にかなっていますか?
よろしくお願いします
編集
例が私のテキストよりも役立つことを願っています。ここで、ID.A = 3 の 2 行目と 3 行目を削除します。
myDF <- read.table(text="ID.A ID.B DISTANCE
1 3 1
2 6 8
3 2 0.4
3 3 1
3 8 5
4 8 7
5 2 11", header = TRUE)