問題タブ [glmnet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - glmnet とクロス検証で変数選択を自動化する方法
glmnet
とbrnn
パッケージの使い方を学んでいます。次のコードを検討してください。
上記のスクリプトは正常に実行されます。
私の質問は次のとおりです。上記のスクリプトを自動化して、 のさまざまな値に対して実行するにはどうすればよいですlocn
かcols <- c(1, 3, 6, 8, 11, 20, 25, 38) # column indices of useful iv's
。現在、これを手動で行うことができますがlocn
、たとえば、のさまざまな値に対して一般的な方法でこれを行う方法がわかりません
r - 予測変数の数が異なるテスト データに対して predict.glmnet を実行できますか?
glmnet を使用して、二項回帰/分類問題のために、約 200 の予測子と 100 のサンプルを含むトレーニング セットで予測モデルを構築しました。
最大 AUC が得られる最適なモデル (16 個の予測子) を選択しました。私は、トレーニング セットから最終的なモデルになった変数 (16 個の予測子) のみを持つ独立したテスト セットを持っています。
トレーニング セットから最終的なモデルになった変数のみのデータを持つ新しいテスト セットを使用して、トレーニング セットの最適なモデルに基づいて predict.glmnet を使用する方法はありますか?
r - R: モデルが再実行されたときの GLMNET の奇妙な動作
変数の選択に LASSO を使用しようとしており、glmnet
パッケージを使用して R での実装を試みました。これは私がこれまでに書いたコードです:
これは、初めて実行したときに得られるものです。
しかし、これは同じコードをもう一度実行すると得られるものです。
モデルがこのように動作する理由がわかりません。係数が実行ごとに変化する場合、どうすれば最終モデルを選択できますか? 実行ごとに異なるチューニング パラメーター $\lambda$ を使用しますか? 私はそれがデフォルトでcv.glmnet
使用すると思った?!model$lambda.1se
私はこのパッケージについて学び始めたばかりです。
ありがとうございました!
r - glmnet を使用して係数の z スコアを取得する
次のように、パッケージを使用してglmnet
LASSOの見積もりを取得しています。
を使用して係数を抽出することはできますが、各変数の標準誤差とZ スコアcoef(model)
を取得する方法がわかりませんでした。
r - R での機械学習の最新パッケージ: Lasso、Random Forest、Neural Nets
R で Lasso、RF、および NN を実装するための最新のパッケージを確認するために、コミュニティに連絡しています。
なげなわ
私の知る限り、for lasso および ridge 回帰にlars
置き換えられました。最先端のパッケージglmnet
だと思います。http://cran.r-project.org/web/packages/glmnet/index.htmlglmnet
ランダムフォレスト
今まで、私は Breiman と Cutler のパッケージrandomforest.
http://cran.r-project.org/web/packages/randomForest/index.htmlを使用してきました
Breiman のランダム フォレストparty
を実装する、Hothorn、Hornik、Strobl、および Zeileis によって呼び出された新しいパッケージがあると思います。cforest()
まだ使っていません。http://cran.r-project.org/web/packages/party/index.html
ニューラルネット
ニューラル ネットの場合、Guenther のneuralnet
パッケージが 2013 年 8 月 29 日にリリースされたばかりです。現在、NN の最良の選択と見なされているかどうかについては、使用していません。 http://cran.r-project.org/web/packages/neuralnet/neuralnet.pdf
r - R, glmnet: cv.glmnet で複製可能な結果を生成できません -- set.seed はそれを行いません
実行するたびcv.glmnet
に、わずかに異なる結果が得られます (モデル選択に最適なラムダなど)。ほとんどの機能とは異なりset.seed()
、問題は解決しません。誰かが問題の原因または解決策を知っていますか?
r - キャレット: switch(tolower(trControl$method) のエラー、oob = NULL、alt_cv = 、cv = createFolds(y,
パッケージを使用caret
して調整alpha
し、モデルのlambda
パラメーターを使用しています。glmnet
私の機能はX
(データフレーム、14474変数の47観測点、p >> N問題)にあり、従属変数y
は47観測点のデータフレームです。1変数の。
やってみると
私は得る
を転置し、代わりに にy
変更しようとしましたが、理解できない同じエラーが発生します。どんな手掛かり?class(y) = "numeric"
"data.frame"
r - family="poisson" の lambda=0 の場合の glmnet の収束の欠如
glmnet と glm を比較しているときに、lambda=0 と family="poisson" の収束の問題に遭遇しました。私の理解では、ラムダ= 0(およびデフォルトのアルファ= 1)では、答えは本質的に同じであるはずです。
以下は、glmnet ヘルプ ページ (?glmnet) の poisson の例からわずかに変更されたコードです。唯一の変更点は、nzc = p であるため、すべての変数が真のモデルにあることです。
ここにエラーメッセージがあります
更新: 問題は、family="poisson" の場合に glmnet によって推定されるインターセプトにあり、ラムダ自体の設定には関係ないようです。