決定木リグレッサーを構築しています。私のサンプル サイズは約 23K で、オーバーフィッティングを避けるためにリーフ内の観測の最小数はどうあるべきかを考えています。私は SAS Miner に取り組んでおり、デフォルト値の 5 で自動的にツリーを構築します。しかし、これが適切なしきい値であるかどうかはわかりません。最小リーフ サイズを 50 にするか 100 にするかを考えています。別のツリーを作成して比較しましたが、満足のいく結果が得られませんでした。一般的に使用されているベストプラクティスまたは比率があるのだろうか。