0

mydata2673 個の観測値と 23 個の変数を持つからトレーニング データとテスト データを作成したいと考えています。ただし、トレーニング データを差し引くだけではテスト セットを作成できません。

dim(mydata)
## [1] 2673   23
set.seed(1)
train = mydata[sample(1:nrow(mydata), 1000, replace=FALSE), ]
dim(train)
## [1] 1000   23

以下を実行すると、19 個の警告が表示され、結果には 20,062 個の観測値が含まれています。

test = mydata[!train, ]
## There were 19 warnings (use warnings() to see them)
dim(test)
## [1] 20062    23

私は何を間違っていますか?

4

1 に答える 1