非常に小さなデータセットに RandomForests を適用することは可能ですか? 多くの変数を持つデータセットがありますが、それぞれ 25 個の観測しかありません。ランダム フォレストでは、OOB エラーが少なく (10 ~ 25%)、妥当な結果が得られます。使用する観測の最小数に関する経験則はありますか? 実際、応答変数の 1 つが不均衡であり、それをサブサンプリングすると、観測数がさらに少なくなります。前もって感謝します
質問する
15185 次