「名前」、「都市」などの予測子を持つトレーニング データでランダム フォレストをトレーニングしようとしています。これら 2 つの予測変数には、32 を超えるカテゴリがあります。それらを含めるにはどうすればよいですか?
他のいくつかのアルゴリズムでさえ、SVM や gbm などのより大きなカテゴリを処理していないようです。
「名前」、「都市」などの予測子を持つトレーニング データでランダム フォレストをトレーニングしようとしています。これら 2 つの予測変数には、32 を超えるカテゴリがあります。それらを含めるにはどうすればよいですか?
他のいくつかのアルゴリズムでさえ、SVM や gbm などのより大きなカテゴリを処理していないようです。