r - データを 70:30 に分割し、分割するたびに異なる範囲のデータを取得する方法

Question

現在、R を使用して、ランダムフォレスト回帰を使用して特徴選択を行っています。データを 70:30 に分割したいのですが、これは簡単です。ただし、これを 10 回実行できるようにしたいと考えています。10 回ごとに、前のものとは異なる例のセットが取得されます。

> trainIndex<- createDataPartition(lipids$RT..seconds., p=0.7, list=F)
> lipids.train <- lipids[trainIndex, ]
> lipids.test <- lipids[-trainIndex, ]

これは私が現在行っていることであり、データを 70:30 に分割するのに最適です。しかし、もう一度実行すると、トレーニングセットのデータと同じ 70% のデータが得られ、テストデータのデータの同じ 30% が得られます。これが createDataPartition の仕組みであることは知っていますが、次に実行するときに別の 70% のデータを取得できるようにする方法はありますか?

ありがとう

score 2 · Accepted Answer

将来的にはcreateDataPartition、ベースRにないため、使用しているパッケージを含めてください。パッケージを使用していると仮定していcaretます。それが正しければ、times議論は見つかりましたか?

trainIndex<- createDataPartition(lipids$RT..seconds., p=0.7, list=F, times=10)

コメントで述べたように、次のように単純に使用できますsample。

sample(seq_along(lipids$RD..seconds), as.integer(0.7 * nrow(lipids)))

またsample、実行されるたびに異なるランダムシードが選択されるため、異なる順序が得られます。

r - データを 70:30 に分割し、分割するたびに異なる範囲のデータを取得する方法

2 に答える 2

Related

Reference