1

Web サイトのカテゴリの個別スコアリング用のスコアラーを構築しています。
入力 :ユーザー ID 、カテゴリ
出力 :ユーザー ID、score_cat_1、score_cat_2 など...

スコアは 10 で与えられます。

私の計画は、最初に各ユーザーの各カテゴリのクリック数をカウントし、次に結果を分位数 (おそらく 1000) で分割し、最後に各カテゴリの分位数に対してクラスター アルゴリズムを使用して、それらを 10 個のクラスターにクラスター化することです。 、レートを与えます。
アイデアは、同じクラスター内で互いに接近している分位数をグループ化し、「10% の最高のクリッカーが 10 を獲得し、次の 10% が 9 を獲得する」などと言うよりも興味深いスコアを獲得することです。

私の問題は次のとおりです
。1-それは良い考えだと思いますか? それを行うためのより自然で正確な方法はありますか?
2-クラスターが小さすぎる可能性があり、各クラスターの基数を保証できません。

4

0 に答える 0