問題タブ [lasso-regression]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Lasso、glmnet、データの前処理
glmnet パッケージを使用して、バイナリ結果 (ロジット) を持つモデルになげなわ (L1 ペナルティ) を当てはめようとしています。私の予測子は、1 つの連続変数を除いて、すべてバイナリです (1/0 は順序付けられておらず、~4000 です)。予測変数をスパース行列に変換する必要があります。そうしないと永遠に、1 日かかるからです。私の質問は、行列を疎行列に変換するだけでなく、sparse.model.matrix を使用しているようです。何故ですか?ここでこれを行う必要がありますか?どちらの方法でも、結果は少し異なります。
また、因子を因子としてコーディングする必要がありますか (結果と予測因子の両方に関して)、またはスパース行列を使用して、結果が二項であることを glmnet モデルで指定するだけで十分ですか?
これが私がこれまでに行っていることです
私の 2 つの質問を要約すると、次のとおりです。[はいの場合、行列を疎行列に変換するのと実際には何が違うのですか] 2-バイナリ変数を因子としてコード化する必要がありますか? 私が尋ねる理由は、私のデータセットが巨大であることです。因子としてコーディングせずにそれを行うだけで、多くの時間を節約できます。
matlab - 定数曲線フィッティングでの LASSO のゼロ出力
定数関数を非線形関数の和で近似したい。通常の最小二乗法ならできるのですが、lasso では近似する関数が定数なので何かがおかしいのです。以下に、Matlab でおもちゃの例を示します。
なげなわが最初に入力と出力から平均を減算することに気付きました。これにより、出力がゼロになり、なげなわから生じるすべての重みがゼロになります。これを回避する方法はありますか?または、重みのまばらな結果を取得する別の方法はありますか?
lambda - LASSO reg in stata (plogit 関数)
私はLASSOメソッドが初めてです(Rでほとんど行われていることは理解していますが、Rはわかりません)。そのため、stata には、なげなわを実行するユーザー作成コード plogit があります (Tony Brady および Gareth Ambler による)。誰かがそれを使用しましたか?
もしそうなら、私の質問は lambda (#) の最適値は何ですか? 20 個の説明変数があります。ラムダ値を 14 にすると、係数は 11 になります。= 0.000、ラムダ = 6 の場合、4 つの変数 = 0.00 が得られます
では、最適値はどれくらいになるでしょうか?ヘルプ plogit では、「ラムダの値が高いほど、より多くのペナルティが導入されます」と表示されます)
どうもありがとう!
r - glmnet は最大ラムダ値をどのように計算しますか?
このglmnet
パッケージは、予測子が選択されていない最大値からスケーリングされたLASSO
調整パラメーターの範囲を使用します。この値を計算する方法を知りたいです。たとえば、単純なデータセットでは次のようになります。lambda
lambda_max
glmnet
lambda_max
パッケージ vignette ( http://www.jstatsoft.org/v33/i01/paper ) は、セクション 2.5 で、この値を次のように計算すると説明しています。
これは明らかに近いですが、同じ値ではありません。では、この違いは何が原因なのでしょうか。lambda_max
関連する質問では、ロジスティック回帰をどのように計算できますか?
r - Rのラッソ回帰から係数を取得するには?
lars
Rのパッケージでなげなわ回帰の係数を取得する方法を教えてもらえますか?
たとえば、コードが次のような場合:
ありがとうございました。
lasso-regression - なげなわ選択の係数と信頼区間
なげなわ法を使用した特徴選択とcovTest::covTest
、p.values を取得するための共分散検定を実施しました。私はそのようなものから例を借りますcovTest
:
covTest の結果は、上位ヒット機能の p 値を示しました。私の質問は、予測子 1 の係数やそのStd.err
およびなどのこれらの機能の係数を取得する方法95%CI
です。これらの見積もりを の対応する見積もりと比較したいと思いglm
ます。
r - glmnet にカスタム ラムダ シーケンスを指定する方法
のglmnet
パッケージは初めてで、公開された研究論文の提案に基づいて関数をR
指定したいと考えていました。ドキュメントは、パラメーターとして減少するシーケンスを提供できることを示唆しています。ただし、ドキュメントには、これを行う方法の例はありません。 lambda
glmnet.cv
lambdas
誰かがこれを行う方法を提案できれば、非常に感謝しています。関数に 100 個の奇数値 ( の既定値nlambda
) のベクトルを渡す必要がありますか? このベクトルの最小値と最大値にはどのような制限が必要ですか? また、ベクトルを指定する際の注意点nvars
などはありますか?nobs
前もって感謝します。