問題タブ [catboost]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
categorical-data - catboost のカテゴリ値あたりの最小サンプル数
サンプル数が少ないカテゴリ値をグループ化するように CatBoost に指示するにはどうすればよいですか。たとえば、「カンボジア」のサンプルが 1 つ、「モンゴル」のサンプルが 2 つしかない Country という列があり、その他の 999,998 か国にはそれぞれ少なくとも 100 のサンプルがあるとします。私は CatBoost に、これらのレアな国でわざわざ CTR マジックを行うのではなく、それらを「その他」として扱うように伝えたいと思います。