0

DB でいくつかの検索手法を適用して、ユーザーの質問に対する回答を返す IR システムを開発しました。f1-Score でパフォーマンスを評価したいのですが、結果の状態が正しいか正しくないかのいずれかになる可能性があるため、TP、TN、FP、FN が何であるかについて少し混乱します。何か案は?それともより適切なテストですか?

4

0 に答える 0