サンプル数が少ないカテゴリ値をグループ化するように CatBoost に指示するにはどうすればよいですか。たとえば、「カンボジア」のサンプルが 1 つ、「モンゴル」のサンプルが 2 つしかない Country という列があり、その他の 999,998 か国にはそれぞれ少なくとも 100 のサンプルがあるとします。私は CatBoost に、これらのレアな国でわざわざ CTR マジックを行うのではなく、それらを「その他」として扱うように伝えたいと思います。
サンプル数が少ないカテゴリ値をグループ化するように CatBoost に指示するにはどうすればよいですか。たとえば、「カンボジア」のサンプルが 1 つ、「モンゴル」のサンプルが 2 つしかない Country という列があり、その他の 999,998 か国にはそれぞれ少なくとも 100 のサンプルがあるとします。私は CatBoost に、これらのレアな国でわざわざ CTR マジックを行うのではなく、それらを「その他」として扱うように伝えたいと思います。