ここで機械学習に関する質問をいくつか見たので、関連する質問を投稿することにしました。
丘陵コースの 10 km と 20 km のランニング競技にアスリートが参加するデータセットがあるとします。つまり、すべての競技には独自の難易度があります。
ユーザーからのフィニッシュタイムは、すべての競技でほぼ逆正規分布になっています。
この問題を行列として書くことができます:
Comp1 Comp2 Comp3
User1 20min ?? 10min
User2 25min 20min 12min
User3 30min 25min ??
User4 30min ?? ??
サイズが 1000x20 で、スパース性が 8% (!) の上記のマトリックスを完成させたいと思います。
すべてのユーザー (能力) のパラメーターとすべての競技のパラメーター (mu、分布のラムダ) を計算できるため、このマトリックスを完成させる非常に簡単な方法があるはずです。さらに、競技間の相関関係は非常に高いです。
ランキング User1 < User2 < User3 および Item3 << Item2 < Item1 を利用できます
どの方法を使用できるかヒントを教えていただけますか?