weka でデータセットを 2 つのランダムな半分に分割したいと考えています。どうすればいいですか?
2238 次
3 に答える
3
同じ質問がありましたが、答えは単純すぎます。まず、weka フィルターを使用してインスタンスの順序をランダムにシャッフルし (Unsupervised-> instances)、データ セットを 2 つの部分に分割する必要があります。以下のリンクで完全な説明を見つけることができます: http://cs-people.bu.edu/yingy/intro_to_weka.pdf
于 2014-09-10T08:02:23.430 に答える
0
アイデアはありますが、Weka ネイティブ API を使用していません。乱数ジェネレーターを使用してみませんか? からまでMath.random()
の数値を生成します。0
1
と に分割dataset
したいset1
としset2
ます。
for every instance in dataset
{
if Math.random() < 0.5
put the instance into set1
else
put the instance into set2
}
このメソッドは、2 つのサブセットに対して同様の数のインスタンスを生成する可能性があると思います。まったく同じ量を生成したい場合は、追加の条件を に追加できますif-else
。
これがあなたにインスピレーションを与えることを願っています。
于 2013-07-20T12:57:26.070 に答える