0

たとえば、このようなn人のデータセットがあります

userID 1 (or 2,3.....up to n)
gender male (or female)
working yes (or No)
income >$5000/month (or <$5000)
have_car yes (or no)

人が車を持っているかどうかを、他の特性 (性別、仕事、収入) に基づいて予測したいと考えています。10,000 人のデータがあるとしたら、トレーニングにどの形式を使用する必要があるか、トレーニングに何人を配置する必要があるか、テストに何人を使用する必要があるか

4

1 に答える 1

0

形式: 数値データを使用する必要があります。したがって、 use はバイナリ決定に 0 と 1 を使用できます。

トレーニング/テスト: 正確な公式はありません。分類に使用する機能があまりないようです。つまり、膨大な量のトレーニングデータが必ずしも必要というわけではありません。最初は 50:50 に分割し、適切な結果が得られるかどうかを確認できます。

于 2012-06-02T12:04:36.190 に答える