問題タブ [glmnet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 多項式の R で cv.glmnet を使用中にエラーが発生しました
データの相互検証を実行するために使用しようとするとcv.glmnet
、エラーが発生しました
以下の行y
は、3 レベルの変数です (as.factor()
元の変数で使用しました)。予測子x
は、1 つの連続変数 (mage) といくつかの因子変数 (ここでもas.factor()
カテゴリ変数で使用されます) で構成されます。オンラインの別の投稿で示唆されているように、すべての予測子をまとめて収集するための私のコードは次のとおりです。
続いて、以下を使用した交差検証が行われます。
誰かが以前にこの問題に直面したことがあるかどうか、考えられる原因は何かと思っていました。
r - glmnet R パッケージの cv.glmnet の「Error in drop(y %*% rep(1, nc))」エラー
cv.glmnet モデルの auc 値を返す関数があり、ほとんどの場合ではありませんが、cv.glmnet 関数を実行すると次のエラーが返されます。
drop(y % % rep(1, nc)) のエラー: 関数 'drop' のメソッドを選択する際に引数 'x' を評価する際のエラー: y % % rep(1, nc) のエラー: 適合しない引数
エラーについて少し読んだことがありますが、私が見つけた唯一の提案は、as.matrix() の代わりに data.matrix() を使用することでした。私の関数は次のとおりです(「フォーム」は目的の変数を含む式で、「dt」はデータフレームです):
この関数を別の関数に実装しています。この関数は、いくつかの変数の組み合わせを反復処理して、どの変数の組み合わせがうまく機能するかを確認します (かなり強引な方法です)。とにかく、エラーがスローされたときに反復の式を印刷し、その式だけで関数を呼び出したところ、正常に機能しました。残念ながら、エラーをスローする呼び出しを特定することはできません。それ以外の場合は、より多くの情報を提供しようとします。データ フレームには約 30 行あり、110 行のより大きなデータ セットでコードを実行してもエラーは発生しません。また、どちらのデータセットにも NA はありません。
誰かがこれを前に見たことがありますか、または何か考えがありますか? ありがとう!
r - glmnet をキャレット行列とスパース行列で使用できますか?
私にとって glmnet を使用する大きなメリットの 1 つは、スパース行列を変換せずに直接操作できることです。ここの投稿は、キャレットの train 関数がトレーニング セットのデータ フレームのみを取り込むことができることを示しているようで、?caret::train も同じことを示唆しています。これは実際にそうですか?
r - glmnet は最大ラムダ値をどのように計算しますか?
このglmnet
パッケージは、予測子が選択されていない最大値からスケーリングされたLASSO
調整パラメーターの範囲を使用します。この値を計算する方法を知りたいです。たとえば、単純なデータセットでは次のようになります。lambda
lambda_max
glmnet
lambda_max
パッケージ vignette ( http://www.jstatsoft.org/v33/i01/paper ) は、セクション 2.5 で、この値を次のように計算すると説明しています。
これは明らかに近いですが、同じ値ではありません。では、この違いは何が原因なのでしょうか。lambda_max
関連する質問では、ロジスティック回帰をどのように計算できますか?