問題タブ [precision-recall]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
4798 参照

r - パッケージROCRを使用したPrecision Recall CurveのAUC

パッケージ ROCR を使用して、Precision Recall Curve の AUC (area Under Curve) を取得する方法..?

0 投票する
1 に答える
1466 参照

r - RのPRROCパッケージによるPrecision-Recall Curve計算

私の質問はこの質問に関連しています。精度-再現率曲線 (PRC) と PRC の下の面積の計算に興味があります。両方のタスクを実行するための素敵な R パッケージPRROCを見つけました。関数pr.curveのパッケージの説明 (5 ページ) によると、2 つのパラメーターを指定する必要があります。1) 陽性クラスのみに属するデータポイントの分類スコア 2) 陰性クラスのみに属するデータポイントの分類スコア(マニュアル 7 ページを参照)。彼らが提供する例は次のとおりです。

私の問題は、陽性クラスに 14000 個のデータポイントがあり、陰性クラスに 2560595 個のデータポイントがあり、そのようなデータの場合、すでに 1 日であり、まだ結果が得られていないことです。簡単にするために、既に与えられた例の拡張を試すことができます。

0 投票する
0 に答える
1659 参照

c++ - dlib を使用したオブジェクト検出器のトレーニング

dlib ライブラリを使用して、 train_object_detector.cpp の例に基づいてオブジェクト検出器をトレーニングしようとしています。

time ./train_object_detector -tv -u 0 --threads 4 --flip data/training.xml

Test detector (precision,recall,AP): 1 0 0は、真陽性 = 0 および偽陽性 = 0 という意味ですか?

また、トレーニング セットの任意の画像に検出器を適用すると、オブジェクトを検出できません。Number of detections: 0.

これを修正する方法は?

0 投票する
2 に答える
10748 参照

python - Pythonで補間を使用して精度再現率曲線を描く方法は?

sklearn precision_recall_curve関数とmatplotlibパッケージを使用して精度と再現率の曲線を描きました。適合率-再現率曲線に精通している方は、この例のように、一部の科学コミュニティが補間された場合にのみそれを受け入れることを知っています。私の質問は、Pythonで補間を行う方法を知っている人がいるかどうかです。私はしばらくの間解決策を探していましたが、成功しませんでした! どんな助けでも大歓迎です。

解決策: @francis と @ali_m による両方の解決策は正しく、一緒に問題を解決しました。precision_recall_curveしたがって、 の関数から出力が得られると仮定するとsklearn、グラフをプロットするために私が行ったことは次のとおりです。

そして、これらの線を for ループに入れて各反復で各メソッドのデータを渡すと、補間された曲線がプロットされます。これは、補間されていない適合率-再現率曲線をプロットしないことに注意してください。

0 投票する
1 に答える
296 参照

elasticsearch - 生データに情報が欠落している場合の適合率と再現率の測定

私のチャットアプリを改善しようとしています:

私のドメインからの以前の (前処理された) チャット インタラクションを使用して、特定のチャット コンテキストに対してユーザーに 5 つの可能な発話を提供するツールを構築しました。たとえば、次のようになります。

Raw : 「やあ、ジョン。」

コンテキスト: こんにちは [[USER_NAME]]
発話: [こんにちは、こんにちは、お元気ですか、こんにちは、またこんにちは]


もちろん、結果は常に関連しているわけではありません。たとえば、次のようになります。

Raw : 「こんにちはジョン。お元気ですか? 元気です。オフィスにいらっしゃいますか?」

コンテキスト: こんにちは [[USER_NAME]] お元気ですか オフィスにいらっしゃいますか
発話: [はい、いいえ、こんにちは、はい、お元気ですか]

私はTF/IDF 類似性モデルと次のような構造のインデックスでElasticsearchを使用しています。

問題:「こんにちは [[USER_NAME]] お元気ですか、オフィスにいらっしゃいますか」という文脈では、「はい、私はいます」という発話が関連していることは確かですが、「はい」、「いいえ」も関連しています。似たような文脈で登場したからです。

出発点として、この優れたビデオを使用しようとしています

Q: (生データから) 知っているのが 1 つの真の発話だけである場合、適合率と再現率を測定するにはどうすればよいですか?

0 投票する
2 に答える
5267 参照

apache-spark - ML パイプラインとメトリクス: 精度、再現率、AUC-ROC、F1Score

私は次のような ML パイプラインを使用しています。

私がしたいのは、Precision, Recall, AUC-ROC, F1-SCORE, ACCURACYこのモデルのような標準メトリックを取得する方法です。BinaryClassificationMetrics見つけましたが、互換性があるかどうか はわかりません。RegressionEvaluator返品のみのようmse|rmse|r2|maeです。

では、ML パイプラインで精度、再現率などを抽出する正しい方法は何ですか?