0

svm(サポート ベクター マシン) やその他のさまざまな分類アルゴリズムを実装する予定です。しかし、私の列車のデータセットは 10Gb です。どうすればサブサンプリングできますか? これは非常に基本的なレベルの質問ですが、私は初心者です。

助けてくれてありがとう

4

2 に答える 2

0

それはあなたのデータに依存します。

あなたは基本レベルの質問に取り組んでいるので、最初の最善のアプローチはサンプル サイズを大幅に削減することだと思います。それが完了したら、機能の数を指定されたサイズに減らします。

データセットが十分に小さく単純になったら、目前の問題に適した属性またはサンプルをさらに追加することを検討できます。

お役に立てれば!

于 2014-12-03T03:14:18.597 に答える