問題タブ [model-comparison]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2587 参照

regression - RMSE とのモデル比較

私はデータ サイエンスの初心者で、モデル選択の助けを求めたいと思います。

給与対年式、役職名、場所を予測するために 8 つのモデルを構築しました。そこで8機種をRMSEで比較してみました。しかし、最終的に、どのモデルを選択すればよいかわかりません。(ランダムフォレストでテストした後、結果は回帰よりも優れているため、モデル8を好みます。最終バージョンを作成するためにすべてのデータセットを使用しましたが、回帰よりもcoefを解釈するのが難しいためです)どのモデルを助けることができますかあなたは好きですか、なぜですか?実際には、データ サイエンティストはこのようなプロセスを行うのでしょうか、それとも自動的に対処する方法を持っているのでしょうか?

1 RMSElm1 : モデル: 線形回帰、データ: 80% のトレーニング、20% のテスト 代入なし = 22067.58

2 RMSElm2:モデル: 線形回帰、データ: 80% をトレーニング、20% をテスト: 給与について同じ考えを与えると思われる場所の代入 = 22115.64

3 RMSElm3: モデル: 線形回帰+ ステップワイズ、データ: 80% のトレーニング、20% のテスト 代入なし = 22081.06

4 RMSEdeep1: モデル: ディープ ラーニング (H2O パッケージのアクティベーション = 'Rectifier'、非表示の c(5,5)、エポック = 100、)、データ: 80% のトレーニング、20% のテスト: 代入なし = 16265.13

5 RMSErf1: モデル: ランダム フォレスト (ntree = 10)、データ: 80% をトレーニング、20% をテスト 代入なし = 14669.92

6 RMSErf2: モデル: ランダム フォレスト (ntree = 500)、データ: 80% をトレーニング、20% をテスト 代入なし [1] 14669.92

7 RMSErf3: モデル: ランダム フォレスト (ntree = 10、)データ: K フォールド 10 代入なし [1] 14440.82

8 RMSErf4 モデル: ランダム フォレスト (ntree = 10)、データ: すべてのデータセット 代入なし [1] 13532.74