問題タブ [roc]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - scikit-learnで事前計算されたカーネルを使用してSVMからROCプロットを作成することは可能ですか?
SVM 分類結果から ROC プロットを作成するために、この例を使用しています: http://scikit-learn.org/0.13/auto_examples/plot_roc.html
ただし、各データ ポイントは、特定の K(X, X) パラダイムに準拠しないカスタム カーネル関数を使用して結合された 4 つの長さ d の特徴ベクトルで効果的に構成されます。そのため、分類を行うために事前計算済みのカーネルを scikit-learn に提供する必要があります。次のようになります。
(上のリンクから) ROC プロットを生成する際の主な障害は、データを 2 つのセットに分割してpredict_proba()
からテスト セットを呼び出すプロセスのようです。事前計算されたカーネルを使用して scikit-learn でこれを行うことは可能ですか?
r - knn を使用した r の変数選択
72 個の観測値と 592 個の変数のデータ フレーム (df) と 1 つの因子クラス変数 (合計 593 個の変数、つまり、dim(df) = 72 593) があります。最適な k 値の選択に受信者動作特性 (ROC) を使用して、7 つの変数 (クラス変数を含む) を選択する方法を探しています。これらの 7 つの変数をグラフィカル モデルを使用した分析に使用したいのですが、変数を無作為に選択したくありません。選択が統計的に正当化されることを望みます。
私の結果として見たいのは次のようなものです:
変数 V23、V120、V230、V333、V496、V585、V593 は、ROC の最高値に基づいて選択されました。
つまり、高精度の「最良の」予測変数の分類と選択を実行して、これらの変数をグラフィカル モデリングに使用できるようにしたいと考えています。
キャレット パッケージを使用してみましたが、それを操作して他の分析に使用できる高精度の変数 (列) を選択する方法がわかりません。
みんなありがとう。誰かが私を理解したと確信しています。
ありがとう。
クテックス。
r - ベイジアン ロジスティック回帰の roc 曲線
ベイジアン ロジスティック回帰の ROC 曲線の実装を手伝ってくれる人はいますか? DPpackageを試してみましたが、それは私ですか、それともうまくいきません。
ROC 曲線を使用して比較したい 2 つのモデルを以下に示します。
Default ~ ACTIVITY + CIF + MAN + STA + PIA + COL + CurrLiq + DebtCov + GDPgr
私の議論はどこにありますか。mydata はデータベースです。mylogit.reduced は、ベイジアンの前に推定されたロジスティック回帰でB0
あり、共分散行列でありsubset=c
、除外された観測値です。
r - glmnet で ROC 曲線をプロットする
編集: Dwin がコメントで指摘したように、以下のコードは ROC 曲線用ではありません。ROC 曲線は、 (以下で行うように) ではt
なく、変動でインデックス付けする必要があります。lambda
機会があれば、以下のコードを編集します。
以下は、バイナリの結果を予測する glmnet の ROC 曲線を作成する試みです。以下のコードで、glmnet の結果を近似するマトリックスをシミュレートしました。ご存じのとおり、入力のn x p行列が与えられると、glmnet は、ラムダの 100 の異なる値について予測確率 [$\Pr(y_i = 1)$]のn x 100 行列を出力します。ラムダのさらなる変化が予測力の増加を停止した場合、出力は 100 より狭くなります。以下の glmnet 予測確率のシミュレートされた行列は、250x69 の行列です。
まず、glmnet ROC 曲線をプロットする簡単な方法はありますか? 第二に、そうでない場合、以下のアプローチは正しいと思われますか? 第三に、(1) 偽陽性/真陽性の確率、または (2) 単に観察された偽陽性/真陽性の割合をプロットすることに関心がありますか?
これについて SO で 1 つの質問がありますが、答えは大まかで、正しくありませんでした: glmnet lasso ROC charts
r - Rでleave-one-out交差検証を使用してAUCを取得するには?
100 個のサンプル (行) と 10000 個の独立した機能 (列) を含むマトリックス (x) があります。観測値は、サンプルが良いか悪いかのバイナリです {0,1} (ベクトル y に格納されます)。クロスバリデーションを除外して実行し、各機能の曲線下面積 (AUC) を個別に決定したいと考えています (CAtools パッケージの colAUC のようなもの)。glmnet を使用しようとしましたが、うまくいきませんでした。マニュアルに記載されているように、nfold パラメータを観測数 (100) に等しくなるように設定しようとしました。
そして、私はこれらの警告を受けています:
私が間違っていることはありますか?また、各機能のLOOバランスの取れたAUC値を取得する他の方法またはRパッケージはありますか?
どんな助けでも本当に感謝します。ありがとうございました!