問題タブ [lasso-regression]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - カテゴリ変数を使用した R での LASSO の使用
1000 個の観測値と 76 個の変数 (そのうち約 20 個はカテゴリ変数) を含むデータセットがあります。このデータ セット全体で LASSO を使用したいと考えています。lars や glmnet を介して LASSO で因子変数を使用しても実際には機能しないことはわかっていますが、変数が多すぎて、数値的に合理的に再コード化するには、変数が取ることができる順序付けられていない値が多すぎます。
この状況でLASSOを使用できますか? どうすればいいですか?予測子の行列を作成すると、次の応答が得られます。
他の方法の方が簡単で適切な場合もありますが、実際には lars や glmnet を使用してこれを行うのが難しいので、可能であればアイデアやフィードバックをいただければ幸いです。
ありがとうございました、
r - glmnet を使用してデータセット内の連続変数を予測する
私はこのデータセットを持っています。 wbh
私は、R パッケージの glmnet を使用して、生殖能力の予測に役立つ予測変数を特定したいと考えました。ただし、おそらくパッケージを完全に理解していないため、そうすることができませんでした。出生変数は SP.DYN.TFRT.IN です。データセット内のどの予測因子が受精率の予測力を最も高めているかを確認したいと考えています。LASSO またはリッジ回帰を使用して係数の数を縮小したかったのですが、このパッケージでそれができることはわかっています。私はそれを実装するのに少し問題があります。
お詫びするコードスニペットがないことは知っていますが、これをどのようにコーディングするかについてはかなり迷っています。
アドバイスをいただければ幸いです。
読んでくれてありがとう