私は、一連の出来事が結果に及ぼす潜在的な影響を示すプロジェクトに取り組んでいます。私は glmnet() パッケージ、特にポアソン機能を使用しています。これが私のコードです:
# de <- data imported from sql connection
x <- model.matrix(~.,data = de[,2:7])
y <- (de[,1])
reg <- cv.glmnet(x,y, family = "poisson", alpha = 1)
reg1 <- glmnet(x,y, family = "poisson", alpha = 1)
**Co <- coef(?reg or reg1?,s=???)**
summ <- summary(Co)
c <- data.frame(Name= rownames(Co)[summ$i],
Lambda= summ$x)
c2 <- c[with(c, order(-Lambda)), ]
最初は SQL でデータベースから大量のデータをインポートします。次に、それを行列形式にして、応答を予測子から分離します。
これは私が混乱しているところです: glmnet() 関数と cv.glmnet() 関数の違いが何であるか正確に理解できません。cv.glmnet() 関数が glmnet() の k 分割交差検証であることは理解していますが、実際には、それは正確には何を意味するのでしょうか? これらはラムダに対して同じ値を提供しますが、2 つの違いについて重要な点を見落としていないことを確認したいと思います。
また、alpha=1 (おそらくデフォルト) を指定すると正常に動作する理由も不明ですが、省略した場合はそうではありませんか?
前もって感謝します!