問題タブ [glmnet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - glmnetラッソROCチャート
(ラッソ回帰を実装する)でk分割交差検定を使用してglmnet
いましたが、これからROCグラフを作成することはできません。
これにより、近似値のログのように見えるベクトルが得られます。この後、いくつかのROCチャートを生成しようとしましたが、機能しませんでした。に入るxオブジェクトとyオブジェクトの性質によるものだと思いますglmnet
。あなたはなにか考えはありますか。
r - glmnet モデルから回帰係数の統計的要約情報を取得することが推奨されないのはなぜですか?
バイナリ結果の回帰モデルがあります。モデルを glmnet に適合させ、選択した変数とその係数を取得しました。
glmnet は変数の重要度を計算しないため、正確な出力 (選択した変数とその係数) を glm に入力して情報 (標準誤差など) を取得したいと考えています。
rドキュメントを検索したところ、glmの「メソッド」オプションを使用してユーザー定義関数を指定できるようです。しかし、私はそうすることができませんでした。誰かがこれを手伝ってくれますか?
r - (Rパッケージパーティの)mob関数のノードモデルとしてglmnetモデルを使用するにはどうすればよいですか?
mob
Rパッケージの機能を使用していますparty
。私の質問は、model
この関数のパラメーターに関するものです。
StatModelオブジェクト(パッケージから)を定義するにはどうすればよいですか?それをglmnetModelmodeltools
と呼びましょう-推定のノードモデルがモデルになるようにします(より正確には、この関数をglmnetModelのスロットの主要な推定関数として使用したいと思います)?mob
glmnet
cv.glmnet
fit
1つの難しさは、ここreweight
で提案されているように関数(およびおそらく関数estfun
とdeviance
関数?)を正しく拡張することです(セクション2.1)。
誰かアイデアがありますか?
注意:いくつかの拡張機能(SVMの場合:ここ)を見ましたが、正しく使用できません。
どうもありがとうございます !
ドミニク
r - glmnet で多くの相互作用項を推定する
glmnet は、各列が説明変数である行列を取ることを理解しています。
〜10個の説明変数を持つデータフレームがあります(そのうちのいくつかは要因です)
y~(x1*x2*x3)+(x4*x5)+x6 などの式を取得し、glmnet を使用してこれを推定するにはどうすればよいですか?
各相互作用項が独自の列を持つマトリックスを作成する必要があると思いますが、入力を式と変数(一部は因子)から取得し、簡単に入力できるマトリックスを出力する方法がわかりませんglmnet。
r - glmnet() を実行する大きな行列
幅広いデータセットで glmnet lasso を実行すると問題が発生します。私のデータは N=50 ですが、p > 49000 で、すべての因子です。したがって、glmnet を実行するには、model.matrix を作成する必要がありますが、model.matrix(formula, data) を呼び出すと、メモリが不足します。ここで、formula = Class ~ です。
実際の例として、データセットを生成します:
その後、glmnet に入力する model.matrix を作成しようとしました。
最後のステップ (X = model.matrix ...) で、メモリが不足しています。私に何ができる?
r - Rキャレットglmnet標準化= FALSE
モデルのレベルでcaret
遊ぶためにパッケージを使用しようとしています。問題は、使用しているデータがすべてダミー変数であり、標準化したくないことです。通常、または単独で使用していた場合は、追加するだけですalpha
glmnet
glmnet
glmnet
cv.glmnet
caret
標準化をオフにする設定はありますか?
r - glmnet の standardize 引数はダミー変数をどのように処理しますか?
私のデータセットには、多数の連続変数とダミー変数があります。glmnet を使用した分析では、ダミー変数ではなく、連続変数を標準化する必要があります。
私は現在、[0,1] の値のみを持つ列のダミー ベクトルを最初に定義し、次にscale
ダミー以外のすべての列に対してコマンドを使用して、これを手動で行っています。問題は、これがあまりエレガントではないことです。
ただし、glmnet にはstandardize
引数が組み込まれています。デフォルトでは、ダミーも標準化されますか? もしそうなら、ダミーをスキップするようglmnetのstandardize
引数に伝えるエレガントな方法はありますか?
r - glmnet で ROC 曲線をプロットする
編集: Dwin がコメントで指摘したように、以下のコードは ROC 曲線用ではありません。ROC 曲線は、 (以下で行うように) ではt
なく、変動でインデックス付けする必要があります。lambda
機会があれば、以下のコードを編集します。
以下は、バイナリの結果を予測する glmnet の ROC 曲線を作成する試みです。以下のコードで、glmnet の結果を近似するマトリックスをシミュレートしました。ご存じのとおり、入力のn x p行列が与えられると、glmnet は、ラムダの 100 の異なる値について予測確率 [$\Pr(y_i = 1)$]のn x 100 行列を出力します。ラムダのさらなる変化が予測力の増加を停止した場合、出力は 100 より狭くなります。以下の glmnet 予測確率のシミュレートされた行列は、250x69 の行列です。
まず、glmnet ROC 曲線をプロットする簡単な方法はありますか? 第二に、そうでない場合、以下のアプローチは正しいと思われますか? 第三に、(1) 偽陽性/真陽性の確率、または (2) 単に観察された偽陽性/真陽性の割合をプロットすることに関心がありますか?
これについて SO で 1 つの質問がありますが、答えは大まかで、正しくありませんでした: glmnet lasso ROC charts
r - Rでleave-one-out交差検証を使用してAUCを取得するには?
100 個のサンプル (行) と 10000 個の独立した機能 (列) を含むマトリックス (x) があります。観測値は、サンプルが良いか悪いかのバイナリです {0,1} (ベクトル y に格納されます)。クロスバリデーションを除外して実行し、各機能の曲線下面積 (AUC) を個別に決定したいと考えています (CAtools パッケージの colAUC のようなもの)。glmnet を使用しようとしましたが、うまくいきませんでした。マニュアルに記載されているように、nfold パラメータを観測数 (100) に等しくなるように設定しようとしました。
そして、私はこれらの警告を受けています:
私が間違っていることはありますか?また、各機能のLOOバランスの取れたAUC値を取得する他の方法またはRパッケージはありますか?
どんな助けでも本当に感謝します。ありがとうございました!