データフレーム内に57の機能(列)から4600行までのデータセットがあります。適切なリッジ回帰パラメーターを計算するために、10分割交差検定を実行したいと思います。誰かがRでこれを行う方法を教えてもらえますか?
3033 次
1 に答える
6
ridge.cv()
parcor
パッケージには、目的のためだけに設計されています。
マニュアルから抜粋した例を次に示します。
> n<-100 # number of observations
> p<-60 # number of variables
> X<-matrix(rnorm(n*p),ncol=p)
> y<-rnorm(n)
> ridge.object<-ridge.cv(X,y)
> ridge.object
$intercept
0.01146743
$coefficients
X1 X2 X3 X4 X5 X6 X7
1.709387e-02 4.833916e-03 3.954463e-03 -9.671448e-03 4.507962e-03 -6.370366e-03 -4.655737e-02
...
X57 X58 X59 X60
-2.119606e-03 -1.229390e-04 -1.912877e-03 -1.833788e-02
$lambda.opt
[1] 540
ここで、$lambda.opt
は10分割交差検定を使用して得られた正則化パラメーターの最適値です。
于 2013-03-06T14:04:34.463 に答える