異なる長さの異なる時系列を含むデータフレームのリストがあります。変数のカウントを要約し、その特定のデータセットに含まれるデータの年数で正規化したいと考えています。
サンプルデータフレームで:
data_list <- list(data.frame(temp_bin = rep(1:4, 2:5), value = runif(14)),
data.frame(temp_bin = rep(1:4, 3:6), value = runif(18)),
data.frame(temp_bin = rep(1:4, 4:7), value = runif(22)))
# this might be ~10 different data sets with ~ 100k observations each
count <- lapply(data_list, function(x) {nrow(x)/5} )
# for real data this would be divided by 8760 for the # of hours in a year.
これは私がやりたいことのおよそですが、カウントはリストであるため、n()/カウントは機能しません。
data_bin <- data_list %>%
lapply(., group_by, temp_bin) %>%
lapply(., summarise, n = n()/count)
n の定義内で lapply または mapply を実行しようとしましたが、うまくいかないようでした。生の n 値を作成し、次のステップで mapply を使用して除算しますが、それも機能しませんでした。