私は複数のサイトを持っています - それぞれが複数回訪問しました。各サイトからの 1 回の訪問のみを含むようにデータをサブセット化し (ただし、その訪問からのすべての観察)、その訪問がすべてのサイトへのすべての訪問の中央値の日付に (時間的に) 最も近いようにしたいと考えています。
サンプルデータ:
d = data.table(site = c('a', 'a','a','a','b', 'b','b', 'b', 'c', 'c', 'c', 'c'),
sex = c('m','f','m','f','m','f','m','f','m','f','m','f'),
date = c(127,127, 185, 185, 132,132, 189,189, 119,119, 178, 178),
count = c(12, 15, 10, 9, 18, 22,12, 15, 10, 9, 18, 22))
私が取得したいもの:
d = data.table(site = c('a', 'a','b', 'b', 'c', 'c'),
sex = c('m','f','m','f','m','f'),
date = c(127,127, 132,132, 178, 178),
count = c(12, 15,18, 22, 18, 22))