問題タブ [auc]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - geom_density/stat_density から AUC の値を表示する方法
ggplot2 と stat_density を使用していくつかの密度プロットを作成しました。私の同僚は、各曲線の下の面積の合計が 1 になるとは確信していないと言いました。それで、私は曲線の下の面積を計算することに着手しました。
これが私がしたことの例です:
結果:
まともに機能しているように見えますが、これを行うより良い方法があるかどうか疑問に思います。特に、間隔の計算 (つまり、dx だと思います) は、特に異なる密度曲線が異なる間隔を使用する場合、問題になる可能性があるようです。
r - R での 3 クラス AUC 計算 (pROC パッケージ)
R で 3 クラス ROC 分析の問題に遭遇し、非常に厄介な結果が得られました (こちらを参照)。今、私はそれを解決するために別の方法を使用しようとしています。データはあり、分類子はパッケージiris
に含まれている多項ロジスティック回帰です。nnet
コードは以下のとおりです。
私の質問は次のとおりです:これはパッケージ
を使用する正しい方法ですか? pROC
どうもありがとう!!!
関連参照:
pROC
パッケージ: http://www.inside-r.org/packages/cran/pROC/docs/multiclass.roc
Hand & Till(2001)
元の論文: http://link.springer.com/article/10.1023%2FA%3A1010920819831
r - キャレット rfe での特徴選択 + ROC による合計
キャレットパッケージを使用して再帰的な機能選択を適用しようとしています。私が必要としているのは、ref がパフォーマンスの尺度として AUC を使用することです。1か月間グーグルした後、プロセスを機能させることができません。これが私が使用したコードです:
このスクリプトを実行すると、次の結果が得られます。
このプロセスでは、パフォーマンスの尺度として常に精度が使用されます。発生する別の問題は、次を使用して取得したモデルから予測を取得しようとするときです。
次のメッセージが表示されます
モデルから何らかの予測を得ることが不可能であることが判明しました。
で得た情報はこちらsessionInfo()
python - Python: x の不均一なステップで曲線下の領域を統合する
y 値のリストと x 値のリストがあります。これらの点によって定義される曲線の下の領域を見つけたいと思います。等間隔の x 値に対するこの問題の解決策をいくつか見つけました。
1)関数を知らずに、一連の座標を指定して曲線の下の面積を計算する
ただし、x 値が等間隔でない場合は、どちらも機能しません。
例えば:
もちろん、上記のコードで x = np.array([0,10,20,30]) を使用すると、予想どおり 30.0 が返されます。
X間隔が不均一な曲線の下の領域を見つける方法を誰かが提案できますか?
r - gbm パッケージの ROC スコア
gbm パッケージを使用して ROC スコア (AUC) を計算できません。ブーストされた回帰木を使用しています。私が実行しているスクリプトは次のとおりです。
「トレーニング データ ROC スコア」と「相互検証 ROC スコア」を他の相関パラメーターと共に生成する必要があります。ROC スコアが得られません。に電話しnames(testing.tc5.lr005)
ました。を呼び出すと、リストされますcv.roc.matrix
が、次のように生成されますtesting.tc5.lr005$cv.roc.matrix
。
[1] 0 0 0 0 0 0 0 0 0 0
ROC AUC をroc(TestData$TN,predTN)
(TestData ~ 予測に使用されるデータ、つまり観測値; predTN ~ 予測値) で計算してみました。という結果になり[1]NA
ます。モデルの残りの部分は、合理的なテストと CV 相関と SE 値でうまく機能しているように見えますが、何が間違っているのかわかりません。私が間違っている場所や別の場所についての指針をいただければ幸いです。ありがとう
r - ROC 曲線をプロットし、特定のカットオフ情報で R の AUC を計算します
このようなデータが与えられた場合: SN = 感度。SP = 特異性
ROC 曲線をプロットして AUC を計算するにはどうすればよいですか。そして、2 つの異なる ROC 曲線間で AUC を比較します。pROC や ROCR などのほとんどのパッケージでは、データの入力は上記のものとは異なります。Rまたは他の方法でこの問題を解決する方法を誰かが提案できますか?
r - パッケージ caTools の R 関数 colAUC が大きなサンプルで失敗する
例えば:
ただし、正常に動作します
与える
私は何か間違ったことをしていますか、それともおそらくバグですか? ROCR::performance は、このサイズのサンプルに対して妥当な答えを生成します。
r - すべての独立変数、ペア、およびトリオで実行されるロジスティック回帰ループを実行するにはどうすればよいですか
ロジスティック回帰の従属変数 (私のデータ セットでは: dat$admit) を、使用可能なすべての変数、ペア、およびトリオ (3 つの独立変数) で実行したいと思います。各回帰は、異なる独立変数と従属変数で行われます。私が取得したい結果は、各回帰要約のリストです: coeff,p-value ,AUC,CI 95%. 以下に提出されたデータセットを使用すると、7 つの回帰があるはずです。
サンプル データ セットを次に示します (dat$admit はロジスティック回帰従属変数です)。
@marek のコメントによると、出力は次のようになります (女性のみの場合、および female & apcalc から): # Intercept Estimate P-Value (Intercept) P-Value (Estimate) AUC 0.5
女性+apcalc 0.000000e+00 0.000000e+00 1 1 0.5
@David Arenburg が書いた、統計を生成する良いコードがありますが、ペアとトリオのモデル作成はありません。そのため、モデル作成を追加する方法を知りたいです。ここに David Arenburg のコードがありますか?
このリストを作成する方法はありますか? ありがとう、ロン