問題タブ [lars]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - ValueError: x_new の値が補間範囲を下回っています
これは、実行時に発生する scikit-learn エラーです。
max_n_alphas を 1e5 から 1e4 に減らすと、このエラーは発生しなくなります。
誰が何が起こっているかについて考えを持っていますか?
呼び出すとエラーが発生します
ディメンションに40k
データ ポイントがあります。40
完全なスタック トレースは次のようになります。
r - 前方回帰および/または LARS を使用して、キャレット内の R の train 関数から係数を取得します
私は R で作業しており、いくつかの方法を使用して、変数の選択と重み付けにキャレットを使用することを検討しています。ここでは、それぞれの調整パラメーターを使用して、前方段階的最小角度回帰 (LARS) を使用して調査しています。以下のコードでは、従属変数 (y) と予測子のサブセット (x) を任意に選択し、データの 70% のサブセットを使用してトレーニング アルゴリズムを介してそれらを実行しました。そのために、10 分割の交差検証を繰り返し適用しています。私が苦労しているのは、トレーニング関数から派生した最終的なモデル パラメーター (切片、ベータ重みなど) を特定するコマンドを見つけることです。object$finalModel を呼び出すと、すぐにはわかりません。リストされている方法 (順方向ステップワイズ回帰と LARS) を使用して R でこれらを回復する方法はありますか? これはあってしかるべきだと思います……。
ありがとう!
r - カテゴリ変数を使用した R での LASSO の使用
1000 個の観測値と 76 個の変数 (そのうち約 20 個はカテゴリ変数) を含むデータセットがあります。このデータ セット全体で LASSO を使用したいと考えています。lars や glmnet を介して LASSO で因子変数を使用しても実際には機能しないことはわかっていますが、変数が多すぎて、数値的に合理的に再コード化するには、変数が取ることができる順序付けられていない値が多すぎます。
この状況でLASSOを使用できますか? どうすればいいですか?予測子の行列を作成すると、次の応答が得られます。
他の方法の方が簡単で適切な場合もありますが、実際には lars や glmnet を使用してこれを行うのが難しいので、可能であればアイデアやフィードバックをいただければ幸いです。
ありがとうございました、
r - LARS "Lasso" 回帰が重要な説明変数を選択しない
大規模なデータ セット n=1918、p=85 でなげなわ回帰を実行していますが、回帰が重要であると特定した係数は、実際に線形モデルに入れると、非常に重要ではありません。もう一方の端では、投げ縄は非常に重要な説明「モデル」変数を 0 に近い係数を持ち、それらを選択しないと見なします。LARS に入るデータフレームは既にスケーリングされています。なぜこれが発生するのかについてのアイデアはありますか? 以下は、LARS が選択する可能性のあるものの例であり、まったく同じデータセットを使用して、実際に適切な説明変数を使用して私が作成したモデルでもあります。
更新: なげなわがすべての温度変数を選択し、それらに比較的高い係数 (>1) を割り当てていることに気付きましたが、残りの変数はすべて 0 と 1 の間にあります。なぜこれが発生しているのかわかりません。