私は焦点を絞った Web クロール (別名、トピック Web クロール) で見てきました。評価指標 - 収穫率 - は次のように定義されています。
たとえば、100 ページをクロールした後、80 の真陽性が得られた場合、その時点でのクローラーの収穫率は 0.9 です。ただし、クローラーは、クロール ドメインに完全に関連しているが、評価比率には含まれていない一部のページをクロールから除外した可能性があります。これは何ですか?その評価指標を改善して、完全に関連性のある見逃したページを含めることはできますか? この配慮は重要ですか?