大規模なデータセットを使用しています。例を以下に示します。個々のファイルの大部分については、処理する必要があり、1日以上のデータが必要です。
Date <- c("05/12/2012 05:00:00", "05/12/2012 06:00:00", "05/12/2012 07:00:00",
"05/12/2012 08:00:00", "06/12/2012 07:00:00", "06/12/2012 08:00:00",
"07/12/2012 05:00:00", "07/12/2012 06:00:00", "07/12/2012 07:00:00",
"07/12/2012 08:00:00")
Date <- strptime(Date, "%d/%m/%Y %H:%M")
c <- c("0","1","5","4","6","8","0","3","10","6")
c <- as.numeric(c)
df1 <- data.frame(Date,c,stringsAsFactors = FALSE)
一日だけデータを残したいです。この日は、その日のデータポイントの数が最も多いことによって選択されます。何らかの理由で(データポイントの最大数で)2日が同点の場合は、記録された個々の値が最も高い日を選択したいと思います。
上記のデータフレームの例では、12月7日が残ります。4つのデータポイントがありますが(12月5日と同様)、この2日間で記録された値が最も高くなります(つまり10)。