システムの最も有名な測定の 1 つは、そのとinformation retrieval
を計算することです。どちらの場合も、関連するドキュメントの総数を計算し、システムが返したドキュメントと比較する必要があります。私の質問は、次のシナリオで関連ドキュメントをどのように見つけることができるかということです:precision
recall
super set
学術論文の完全な名前を受け入れ、いくつかのアルゴリズムに基づいて、関連する論文のリストを返すことを仕事とする学術検索エンジンがあるとします。ここで、システムの精度が高いかどうかを判断するために、精度と再現率を計算します。しかし、関連する一連の論文をどのように作成できるかわかりません - 検索エンジンは、さまざまなユーザーのクエリに関してそれらを返す必要があります - それに応じて、適合率と再現率を計算します。