0

R を使用して最適なモデルを選択するプロジェクトに取り組んでいます。

15 個の変数があり、サンプル サイズは 790,000 です。線形モデルは、残差がランダムではなく、正規ではないため機能しません。

そこで、より高い多項式と相互作用で非線形モデルを実行しようとしました。ただし、R は非常に遅く、データセットが大きいため時々シャットダウンします。

ステップワイズ関数、ポリム関数を使用してみましたが、どちらも理想的ではありませんでした。高次多項式と相互作用のための関数/パッケージはありますか? ループを書くとしたら、プロットを見ずに各シナリオの残差の正規性とランダム性をチェックするにはどうすればよいでしょうか? (Sharpe テストは、大きなサンプル サイズでは機能しません)。どうもありがとう!

更新: fit2b <- lm(f$Assets ~ polym(f$C,f$Suc,f$SP,f$SS, f$Qual_P, f$A, f$TotalAA, f$Eq,f$D, f $PE, f$EI, f$GE, f$EO, 次数 = 5, raw=TRUE) + f$Gender + f$LT)

fit1b = lm(f$Assets ~ f$A)

step(fit1b, scope = list(upper=fit2b, lower=~1 ), direction = "forward", trace=FALSE)

また、vif 以外に多重共線性を検出するツールが他にあるかどうか、またそれに対処するためにモデルをどのように調整すればよいか疑問に思っています。

4

0 に答える 0