問題タブ [overfitting-underfitting]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regression - テストとトレーニングの RMSE の違いが有意であるかどうかを知る方法
テストおよびトレーニング エラーの RMSE 値に基づいて、モデルがオーバーフィット/アンダーフィットしているかどうかを把握しようとしています。
トレーニング データでは、RMSE は 0.283 です。
テスト データでは、RMSE は 0.758 です。
RMSE(test) > RMSE(train) であるため、モデルが過適合であると結論付けたいのですが、この違いはこれを結論付けるのに十分重要ですか?
これはランダム フォレスト回帰モデルであり、Y(従属変数) の値は範囲 (2-7) にあります
machine-learning - デシジョン ツリー回帰で最小リーフ サイズを決定する際のベスト プラクティスはありますか?
決定木リグレッサーを構築しています。私のサンプル サイズは約 23K で、オーバーフィッティングを避けるためにリーフ内の観測の最小数はどうあるべきかを考えています。私は SAS Miner に取り組んでおり、デフォルト値の 5 で自動的にツリーを構築します。しかし、これが適切なしきい値であるかどうかはわかりません。最小リーフ サイズを 50 にするか 100 にするかを考えています。別のツリーを作成して比較しましたが、満足のいく結果が得られませんでした。一般的に使用されているベストプラクティスまたは比率があるのだろうか。