r - R の lm 関数で交差検証を 1 つ除外する

翻译自：https://stackoverflow.com/questions/21371090 2014-01-27T00:15:21.190

4970 次

Leave-one-out Cross Validation を実行している 506 行のデータセットがあります。平均二乗誤差を取得したら、見つけた平均二乗誤差の平均を計算しています。これは、実行するたびに変化しています。これは期待されていますか？もしそうなら、誰かがそれを実行するたびに変化する理由を説明できますか?

CVを1つ除外するには、最初に行をシャッフルします.dfはデータフレームです

df <-df[sample.int(nrow(df)),]

次に、データフレームを 506 個のデータフレームに分割して lm() に送信し、各データフレーム (この場合は各行) の MSE を取得します。

fit <- lm(train[,lastcolumn] ~.,data = train)
pred <- predict(fit,test)
pred <- mean((pred - test[,lastcolumn])^2)

そして、取得したすべての MSE の平均をとります。

これをすべて実行するたびに、異なる平均値が得られます。これは期待されていますか？

r - R の lm 関数で交差検証を 1 つ除外する

1 に答える 1

Related

Reference