0

ドキュメントに従って、カタログのトレーニング データを作成しました。

https://www.ibm.com/smarterplanet/us/en/ibmwatson/developercloud/doc/retrieve-rank/training_data.shtml

私のトレーニング データでは、回答に関係のないレコードについては、ゼロの値を指定しました。ドキュメントによると、「0」の関連性ラベルは、回答が関連性がないことを示すものとして事前定義されています。

トレーニング データが正常に完成し、ranker_id を取得しました。fcselect と ranker_id を使用してクエリを実行すると、クエリの最上位の結果が、関連がないことを意味する「0」とマークした結果であることがわかりました。

ドキュメントは、次のように 10 の高いスコアを持つことが示されています。

<float name="score">10.0</float> 
<str name="featureVector">0.11107889 0.046247214 0.0 0.046247214 0.0 0.0 0.0 0.0 0.096357614 0.04101021 0.0 0.04101021 0.0 0.0 0.0 0.0 0.6666667 0 0.6931471805599453 10.0</str>

このスコアと、トレーニング データで提供される関連性を理解するための洞察を探しています。期待される結果が得られるように、トレーニング データや関連性を改善するにはどうすればよいですか。

4

0 に答える 0