ドキュメントに従って、カタログのトレーニング データを作成しました。
私のトレーニング データでは、回答に関係のないレコードについては、ゼロの値を指定しました。ドキュメントによると、「0」の関連性ラベルは、回答が関連性がないことを示すものとして事前定義されています。
トレーニング データが正常に完成し、ranker_id を取得しました。fcselect と ranker_id を使用してクエリを実行すると、クエリの最上位の結果が、関連がないことを意味する「0」とマークした結果であることがわかりました。
ドキュメントは、次のように 10 の高いスコアを持つことが示されています。
<float name="score">10.0</float>
<str name="featureVector">0.11107889 0.046247214 0.0 0.046247214 0.0 0.0 0.0 0.0 0.096357614 0.04101021 0.0 0.04101021 0.0 0.0 0.0 0.0 0.6666667 0 0.6931471805599453 10.0</str>
このスコアと、トレーニング データで提供される関連性を理解するための洞察を探しています。期待される結果が得られるように、トレーニング データや関連性を改善するにはどうすればよいですか。