mydata
2673 個の観測値と 23 個の変数を持つからトレーニング データとテスト データを作成したいと考えています。ただし、トレーニング データを差し引くだけではテスト セットを作成できません。
dim(mydata)
## [1] 2673 23
set.seed(1)
train = mydata[sample(1:nrow(mydata), 1000, replace=FALSE), ]
dim(train)
## [1] 1000 23
以下を実行すると、19 個の警告が表示され、結果には 20,062 個の観測値が含まれています。
test = mydata[!train, ]
## There were 19 warnings (use warnings() to see them)
dim(test)
## [1] 20062 23
私は何を間違っていますか?