問題タブ [glmnet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Rのglm関数で可能なのに、glmnetに1列しか渡せないのはなぜですか?
ベースからの関数で可能であるのに、パッケージglmnet
からの関数でモデルに1つの説明変数のみを渡す可能性がないのはなぜですか? コードとエラーは次のとおりです。glmnet
glm
r - Rのglmnet()とcv.glmnet()の違いは?
私は、一連の出来事が結果に及ぼす潜在的な影響を示すプロジェクトに取り組んでいます。私は glmnet() パッケージ、特にポアソン機能を使用しています。これが私のコードです:
最初は SQL でデータベースから大量のデータをインポートします。次に、それを行列形式にして、応答を予測子から分離します。
これは私が混乱しているところです: glmnet() 関数と cv.glmnet() 関数の違いが何であるか正確に理解できません。cv.glmnet() 関数が glmnet() の k 分割交差検証であることは理解していますが、実際には、それは正確には何を意味するのでしょうか? これらはラムダに対して同じ値を提供しますが、2 つの違いについて重要な点を見落としていないことを確認したいと思います。
また、alpha=1 (おそらくデフォルト) を指定すると正常に動作する理由も不明ですが、省略した場合はそうではありませんか?
前もって感謝します!
r - オンライン SGD で使用される glmnet (R) のラムダ
私はパッケージcv.glmnet
から(で)使用しています。結果として、 のベクトル(正則化パラメーター) が得られます。オンライン SGD アルゴリズムで使用したいと思います。そうする方法はありますか?glmnet
R
lambda
どんな提案も役に立ちます。
R パッケージの cv.glmnet 関数を使用してオフラインで一度計算された l1 正則化および二項分布 (ロジスティック リンク関数) を持つ一般化線形モデルの結果 (モデルの係数および正則化出力パラメーターの観点から) をどのように比較できるか疑問に思っています。 Raphson-Newton推定アルゴリズムと同じタイプのオンライン評価モデルを使用すると思いますが、確率的勾配降下アルゴリズム(クラシック、タイプI)を使用して、新しい観測ごとに推定値が再計算されます。
r - R の cv.glmnet 関数の概要はありますか?
要約関数のための独自のメソッドを持つ glm 関数を使用して、R で通常の一般化された線形モデルを実行でき、各変数の p 値が出力されるモデルを要約できます。これらの p 値に応じて、どの変数が統計的に有意であるか、または特定の信頼水準で有意ではないかを判断できます。
私の質問はです。パッケージのcv.glmnet
機能に同じ機能はありますか? glmnet
計算後、係数coef(model, s="lambda.min")
の一部がゼロではないテーブルを受け取ることができることを知っています。したがって、ゼロ以外の値は統計的に有意であると (おそらく間違って) 想定しています。私は正しいですか?これらの係数の p 値または信頼区間を提供する方法はありますか?
r - R: glmnet パッケージを使用したリッジ回帰のハット行列
glmnetパッケージ (R) を使用しています。係数の有意性をテストするために、リッジ回帰のハット行列を抽出する必要があります。関数glmnetのドキュメントとソース コードを調べましたが、このマトリックスにアクセスする方法についての手がかりは見つかりませんでした。この特定のパッケージを使用して、それが可能かどうか誰かが知っていますか?
r - R でライブラリ glmnet の cv.glmnet を使用したいと考えています。私の変数の 1 つは、型係数の曜日の文字表現です。これどうやってするの?
因子変数である変数「nameDay」を含むデータフレームがあります。曜日は文字 (「土曜日」、「月曜日」...) で表されますが、因数に変換しました。再現用のこのデータフレームの上位 6 行は次のとおりです。
関数 cv.glmnet (ライブラリ glmnet から) では、データをデータフレームではなくマトリックスとして渡す必要があります。したがって、データフレームをマトリックスに変換します。
応答変数であるため、最初の列を取り出します。応答ベクトルの数値ベクトルを作成します。
最後に、なげなわ回帰モデルを適合させようとします。
次のエラー メッセージが表示されます。
elnet(x, is.sparse, ix, jx, y, weights, offset,
type.gaussian, のエラー: 外部関数呼び出しの NA/NaN/Inf (arg 5)
追加: 警告メッセージ: elnet(x, is .sparse, ix, jx, y, weights,
offset, type.gaussian, : 強制によって導入された NA
元のデータフレームの「nameDay」変数が原因だと思いますが、よくわかりません。これを修正する方法についてのアイデアはありますか?
ありがとう
r - plot.glmnet 変数ラベルのサイズを大きくする
現在、glmnet パッケージを使用してなげなわ回帰を実行しています (以下の例では、「fits」変数に保存されています。その後、fits 変数をプロットすると、適切に表示されますが、係数ラベルは非常に小さいです。方法のアイデアはありますか?これらのサイズを大きくすることはできますか?
以下の再現可能な例...