18 の日付 (例: 一意DAY
の 、MONTH
、YEAR
) と 10 の変数があります。日付と変数 (180 モデル) ごとに lm モデル (y = mx + b、ここで y =value
および x = ) があります。pLength
これらはリスト (つまりmodels
) に格納されます。
これらのモデルを使用して値を予測したいと考えています。DAY
次の列を持つ data.frame (値を受け取るための data.frame) が MONTH
ありYEAR
ますpLength
。
たとえば、モデルが日付と変数の組み合わせ = 7.8.2013.Var1 の場合、7.8.2013 に発生するVar1
すべての予測があるはずpLength
です。
この目的のために、受信した data.frame から作成された別のリストを使用しようとしました。このリスト (すなわちrec_List
) は、受信する data.frame の 152 分割です。これらの分割はDAY
、 、MONTH
、YEAR
およびの一意の行ですpLength
。これらは、異なる でグループ化された上記と同じ 18 の日付ですpLength
。の値と数はpLength
日付によって異なります。
私の現在のアプローチでは、予測でリストを使用しようとしている別の投稿からの情報を使用しようとしました(ただし、変数は1つだけです)。これは私にとってはうまくいきません。日付ごとに各 pLength の各変数の予測を取得する代わりに、モデルの数と同じ合計 180 の無計画な予測が得られます。
# Current Output 'preds'
X1 DAY MONTH YEAR pLength value
7.8.2013.Var1 7 8 2013 0.00 0.00
7.8.2013.Var2 7 8 2013 0.25 1.07
7.8.2013.Var3 7 8 2013 0.33 6.25
etc
# Desired Output
X1 DAY MONTH YEAR pLength value
7.8.2013.Var1 7 8 2013 0.00 0.00
7.8.2013.Var2 7 8 2013 0.00 1.10
7.8.2013.Var3 7 8 2013 0.00 6.55
...
7.8.2013.Var10 7 8 2013 0.00 100.10
7.9.2013.Var1 7 9 2013 0.25 0.00
7.9.2013.Var2 7 9 2013 0.25 1.15
etc
上記の現在の出力を見たとき、data.frame リストの受信で行を複製してDAY
、 、MONTH
、YEAR
およびをそれぞれpLength
10 回複製できるのではないかと考えました。これはうまくいきませんでしたが、これになりました。
# with duplicated rows
X1 DAY MONTH YEAR pLength value
1 7.8.2013.Var1 7 8 2013 0.0000000 0.000000e+00
2 7.8.2013.Var1 7 8 2013 0.0000000 0.000000e+00
3 7.8.2013.Var1 7 8 2013 0.0000000 0.000000e+00
4 7.8.2013.Var1 7 8 2013 0.0000000 0.000000e+00
5 7.8.2013.Var1 7 8 2013 0.0000000 0.000000e+00
6 7.8.2013.Var1 7 8 2013 0.0000000 0.000000e+00
7 7.8.2013.Var1 7 8 2013 0.0000000 0.000000e+00
8 7.8.2013.Var1 7 8 2013 0.0000000 0.000000e+00
9 7.8.2013.Var1 7 8 2013 0.0000000 0.000000e+00
10 7.8.2013.Var1 7 8 2013 0.0000000 0.000000e+00
11 7.8.2013.Var2 7 8 2013 0.2500000 1.072500e+00
行1〜10が7.8.2013およびpLength = 0.00のVar1〜10になることを望んでいました。
問題は、予測を作成するために等しくないリストを cbinding しているという事実にある可能性があることを知っていますが、予測でモデルのリストを使用する方法については不明です。行の複製がそれを助けてくれると思いました。
簡単に言うと、10 個の変数のそれぞれについて、すべての日付と pLength の組み合わせを予測したいと思います。これは、他の投稿に質問して読んだ後にこれを行うことを現在考えることができる唯一の方法であるため、リストでこれを実行しようとしています。
# code with abbreviated data
require(plyr)
require(reshape2)
mdata2 <- structure(list(DAY = c(7L, 8L, 7L, 8L, 7L, 8L, 7L, 8L, 7L, 8L,
7L, 8L, 7L, 8L, 7L, 8L, 7L, 8L, 7L, 8L, 7L, 8L, 7L, 8L, 7L, 8L,
7L, 8L, 7L, 8L, 7L, 8L, 7L, 8L, 7L, 8L, 7L, 8L, 7L, 8L), MONTH = c(8L,
6L, 8L, 6L, 8L, 6L, 8L, 6L, 8L, 6L, 8L, 6L, 8L, 6L, 8L, 6L, 8L,
6L, 8L, 6L, 8L, 6L, 8L, 6L, 8L, 6L, 8L, 6L, 8L, 6L, 8L, 6L, 8L,
6L, 8L, 6L, 8L, 6L, 8L, 6L), YEAR = c(2013L, 2012L, 2013L, 2012L,
2013L, 2012L, 2013L, 2012L, 2013L, 2012L, 2013L, 2012L, 2013L,
2012L, 2013L, 2012L, 2013L, 2012L, 2013L, 2012L, 2013L, 2012L,
2013L, 2012L, 2013L, 2012L, 2013L, 2012L, 2013L, 2012L, 2013L,
2012L, 2013L, 2012L, 2013L, 2012L, 2013L, 2012L, 2013L, 2012L
), pLength = c(1L, 1L, 0L, 0L, 1L, 1L, 0L, 0L, 1L, 1L, 0L, 0L,
1L, 1L, 0L, 0L, 1L, 1L, 0L, 0L, 1L, 1L, 0L, 0L, 1L, 1L, 0L, 0L,
1L, 1L, 0L, 0L, 1L, 1L, 0L, 0L, 1L, 1L, 0L, 0L), variable = structure(c(1L,
1L, 1L, 1L, 2L, 2L, 2L, 2L, 3L, 3L, 3L, 3L, 4L, 4L, 4L, 4L, 5L,
5L, 5L, 5L, 6L, 6L, 6L, 6L, 7L, 7L, 7L, 7L, 8L, 8L, 8L, 8L, 9L,
9L, 9L, 9L, 10L, 10L, 10L, 10L), .Label = c("Rain", "Wind", "WindD",
"TempA", "TempF", "RH", "FuelM", "WindMax", "PAR", "VPD"), class = "factor"),
value = c(0, 0, 0, 0, 0.51, 1.096, 1.26, 1.472, 67.59440741,
0.153388889, 67.59440741, 0.153388889, 30.17, 31.73, 31.06,
31.78, 33.52, 46.9, 40.06, 43.66, 55.62, 27.81, 50.75, 27.82,
13.33, 0.842, 10.39, 5.783, 0.727, 1.58, 2.247, 2.234, 1105,
1740, 1767, 1969, 1.90257357, 3.351394626, 2.17506063, 3.373580125
)), .Names = c("DAY", "MONTH", "YEAR", "pLength", "variable",
"value"), row.names = c(1L, 2L, 19L, 20L, 37L, 38L, 55L, 56L,
73L, 74L, 91L, 92L, 109L, 110L, 127L, 128L, 145L, 146L, 163L,
164L, 181L, 182L, 199L, 200L, 217L, 218L, 235L, 236L, 253L, 254L,
271L, 272L, 289L, 290L, 307L, 308L, 325L, 326L, 343L, 344L), class = "data.frame")
vs2 <- structure(list(DAY = c(8L, 8L, 8L, 8L, 8L, 8L, 7L, 7L, 7L, 7L,
7L, 7L, 7L, 7L, 7L), MONTH = c(6L, 6L, 6L, 6L, 6L, 6L, 8L, 8L,
8L, 8L, 8L, 8L, 8L, 8L, 8L), YEAR = c(2012L, 2012L, 2012L, 2012L,
2012L, 2012L, 2013L, 2013L, 2013L, 2013L, 2013L, 2013L, 2013L,
2013L, 2013L), pLength = c(0, 0.222222222, 0.444444444, 0.666666667,
0.888888889, 1, 0, 0, 0.25, 0.333333333, 0.5, 0.75, 0.666666667,
1, 1)), .Names = c("DAY", "MONTH", "YEAR", "pLength"), row.names = c("1:89",
"1:90", "1:91", "1:92", "1:93", "1:94", "2:6", "2:23", "2:31",
"2:39", "2:49", "2:69", "2:71", "2:87", "2:96"), class = "data.frame")
# ** code edited to reflect answer below **
models <- dlply(mdata2, c("variable", "DAY", "MONTH", "YEAR"), function(df)
lm(value ~ pLength, data = df))
rec_List <- dlply(unique(vs2), c("DAY", "MONTH", "YEAR"))
preds <- mdply(cbind(mod = models, df = rec_List), function(mod, df) {
mutate(df, value = predict(mod, newdata = df))
})