大規模なデータセットのを計算しようとしてAUC
いますが、0または1だけでなく、適度に高速に動作する値の両方を処理するデータセットを見つけるのに問題があります。
これまでパッケージを試しましたROCR
が、0と1しか処理できず、pROC
パッケージから回答が得られますが、100万行を計算するのに5〜10分かかる場合があります。
注意として、私の値はすべて0から1の間にありますが、必ずしも1または0である必要はありません。
編集:答えと予測の両方が0-1の間にあります。
助言がありますか?
EDIT2:
ROCR
このような状況に対処できます:
Ex.1
actual prediction
1 0
1 1
0 1
0 1
1 0
またはこのように:
Ex.2
actual prediction
1 .25
1 .1
0 .9
0 .01
1 .88
しかし、このような状況ではありません:
Ex.3
actual prediction
.2 .25
.6 .1
.98 .9
.05 .01
.72 .88
pROC
Ex.3を処理できますが、計算に非常に長い時間がかかります。Ex.3のような状況では、より高速な実装ができることを期待しています。