r - Rの2つのデータフレームから同じX行数をランダムに選択します

Question

私は R で分類を行っています。testD と呼ばれるテストデータのデータフレームと、results と呼ばれるデータのデータフレームがあります (これらは正しい分類値です)。

これらのデータフレームは非常に大きく、セット全体でモデルをトレーニングするには時間がかかりすぎるため、約 5,000 のデータポイントをランダムに選択してトレーニングしたいと考えています。

いずれかのデータフレームから 5,000 行をランダムに選択する方法は知っていますが、「testD」から選択した行を正確に知る必要があるため、「結果」のどの 5,000 行と比較するかがわかります。

どんな助けでも大歓迎です！

score 9 · Accepted Answer

これは次の方法で実行できます。

indices = sample(NROW(testD), 5000)
testD.sample = testD[indices, ]
results.sample = results[indices, ]

1 に答える 1