さまざまな値のセットに線形回帰を当てはめようとしてきましたが、少し奇妙なことがわかりました。関数 rxLinMod() で線形回帰を取得しようとするたびに、係数の 1 つが削除され、lm() を使用するたびに、これは発生しません。
問題を引き起こしたデータセットは次のとおりです。
日付 | 値 |
---|---|
2020-06-19 | 5950 |
2020-06-16 | 5950 |
rxLinMod を使用すると、次のようになります。
rxLinMod(formula = Values ~ Dates, data = temp)
Rows Read: 2, Total Rows Processed: 2, Total Chunk Time: 0.001 seconds
Computation time: 0.006 seconds.
Call:
rxLinMod(formula = Values ~ Dates, data = temp)
Linear Regression Results for: Values ~ Dates
Data: temp
Dependent variable(s): Values
Total independent variables: 2 (Including number dropped: 1)
Number of valid observations: 2
Number of missing observations: 0
Coefficients:
Values
(Intercept) 5950
Dates Dropped
一方、lm() はこれを返します。
Call:
lm(formula = Values ~ Dates, data = temp)
Coefficients:
(Intercept) Dates
5.950e+03 -1.829e-13
どの変数も因子として扱われていないこと、Date が Date クラス、Values が数値クラスであることを確認しました。勾配が 0 にかなり近いと予想していました。最初の勾配で係数が低下する理由を知っている人はいますか?
他に知りたいことがあれば、遠慮なく聞いてください。