たとえば、このようなn人のデータセットがあります
userID 1 (or 2,3.....up to n)
gender male (or female)
working yes (or No)
income >$5000/month (or <$5000)
have_car yes (or no)
人が車を持っているかどうかを、他の特性 (性別、仕事、収入) に基づいて予測したいと考えています。10,000 人のデータがあるとしたら、トレーニングにどの形式を使用する必要があるか、トレーニングに何人を配置する必要があるか、テストに何人を使用する必要があるか