44

いくつかの機械学習モデルを構築しようとしていますが、

トレーニングデータと検証データが必要です

N個の例があるとします。データフレームでランダムなx例を選択したいと思います。

たとえば、100 個の例があり、10 個の乱数が必要だとします。サンプル データからトレーニング データを抽出するために、10 個の乱数 INTEGER を (効率的に) 生成する方法はありますか?

while ループを使用して、繰り返し数をゆっくりと変更してみましたが、実行時間があまり理想的ではないため、より効率的な方法を探しています。

誰か助けてくれませんか?

4

3 に答える 3

67

sample(またはsample.int)はこれを行います:

sample.int(100, 10)
# [1] 58 83 54 68 53  4 71 11 75 90

1 ~ 100 の範囲から 10 個の乱数を生成します。あなたはおそらくreplace = TRUE、どのサンプルを置き換えて欲しいですか:

sample.int(20, 10, replace = TRUE)
# [1] 10  2 11 13  9  9  3 13  3 17

より一般的には、任意の値のベクトルから観測をsampleサンプリングします。n

于 2013-07-21T13:59:13.577 に答える