0

私の質問はこの質問に関連しています。精度-再現率曲線 (PRC) と PRC の下の面積の計算に興味があります。両方のタスクを実行するための素敵な R パッケージPRROCを見つけました。関数pr.curveのパッケージの説明 (5 ページ) によると、2 つのパラメーターを指定する必要があります。1) 陽性クラスのみに属するデータポイントの分類スコア 2) 陰性クラスのみに属するデータポイントの分類スコア(マニュアル 7 ページを参照)。彼らが提供する例は次のとおりです。

# create artificial scores as random numbers
x <- rnorm( 1000 );
y <- rnorm( 1000, -1 );
# compute PR curve
pr <- pr.curve( x, y, curve = TRUE );

私の問題は、陽性クラスに 14000 個のデータポイントがあり、陰性クラスに 2560595 個のデータポイントがあり、そのようなデータの場合、すでに 1 日であり、まだ結果が得られていないことです。簡単にするために、既に与えられた例の拡張を試すことができます。

# create artificial scores as random numbers
x <- rnorm( 14000 );
y <- rnorm( 2560595, -1 );
# compute PR curve
pr <- pr.curve( x, y, curve = TRUE );
4

1 に答える 1