太陽光発電所のデータを分析しています。推定生産プラントを次の日ごとに調整したかったのですが、取得できるデータは次の 3 日間の天気予報であるため、明日はどのような日になるかがわかります (1 から 5 のスケールで、1 を 1 として晴れ 5 曇り)。
したがって、容量に係数を掛けることが考えられるため、これは発生するものの推定値であり、実際の測定値から逸脱するものではありません.
1 日の変動タイプを因子として使用することにより、線形モデルを確立すると考えました。実際の生産に近づけるための最良の方法かもしれません。
今日の基準は次のとおりです。
- デイタイプ1、生産能力※1
- デイタイプ2、生産能力×0.7
- 日型3、生産能力×0.4
- 日型4、生産能力×0.15
- 日型5、生産能力※0
私はこれらの係数を調査しましたが、植物の生産量は過小評価されています。つまり、実際にはより多くのエネルギーが生産されており、ほぼ 50% 近くです。Excel のソルバーを使用して、得られる係数を見つけます。
- 1.6
- 1.2
- 0.9
- 0.65
- 0.5
問題は、これはデータのこの特定のケースのみであり、モデルを作成したかったため、一般化できないことです)。
これは私が適用したものです:
data <-read.table ("zcinco.txt", dec = ",", header = TRUE)
head (data)
model <- lm (data [-1.2] ~ embed (data [, 2], 2) [, 2] + as.factor (data [-1.3]) + data [1, 4])
head (cbind (matrix (predict (model)), data [-1.2]))
summary (model)
Call:
lm(formula = data[-1, 2] ~ embed(data[, 2], 2)[, 2] + as.factor(data[-1,
3]) + data[-1, 4])
Residuals:
Min 1Q Median 3Q Max
-0.054966 -0.009518 -0.000855 0.010966 0.039100
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.528e-06 1.456e-03 0.002 0.9986
embed(data[, 2], 2)[, 2] 3.870e-01 2.969e-02 13.036 < 2e-16 ***
as.factor(data[-1, 3])2 -2.630e-03 1.407e-03 -1.869 0.0621 .
as.factor(data[-1, 3])3 1.690e-03 2.371e-03 0.713 0.4762
as.factor(data[-1, 3])4 -1.855e-02 2.251e-03 -8.241 1.07e-15 ***
as.factor(data[-1, 3])5 -1.790e-02 2.660e-03 -6.727 4.06e-11 ***
data[-1, 4] 8.930e-01 4.823e-02 18.517 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.01482 on 600 degrees of freedom
Multiple R-squared: 0.795, Adjusted R-squared: 0.793
F-statistic: 387.9 on 6 and 600 DF, p-value: < 2.2e-16
ベースの説明。
ティエンポ / リアル / ティポ / カパシダード
- Tiempo: 観測が行われた時刻を示します。
- 実際の測定値は、実際のエネルギー生産を示します。
- Tipo: 観測された日のタイプを示します (1 から 5)。
- Capacidad: 計画の推定生産能力の割合