0

比較的単純なアルゴリズムの問​​題があり、ユーザーに質問をお勧めします

  1. 回答付きの一連の質問があります(各回答のコメントなど)
  2. それぞれの質問がどれほど魅力的かを評価したいと思います。

現在の実装:

(total comments + likes for all answers for a question) / sqrt (number of answers)

問題:

  1. 場合によっては、1トンのアクティビティがある1つの回答が、他の20の回答がほとんど関心を持たない場合でも、質問のスコアを歪めることがあります。
  2. 回答が非常に少ない質問には、ある程度の削減を適用する必要があります。

これらの2つの問題に関する提案は否定できます。

4

1 に答える 1

0

通常、1つのサンプルが強力になりすぎないようにする場合、標準的な方法は次のいずれかです。

  1. log(N)の代わりに使用Nして、各観測の効果を弱めます1
  2. 「奇妙な」観測値を除外します。中央のX%のみを取得し、それらを使用します。たとえば、この質問の最大値から1 / 4〜3 / 4のいいねを含む観測値のみを取得し、偏った例を除外します。

2番目の問題(私が考えることができることの1つは、さまざまな要素を与えることです。代わりにを使用して)を使用して、データセット内の質問ごとの回答の最大数を sqrt(number of answers)試すことができ(number_of_answers)^(log(number_of_answers+1)/log(max_answers+1))ます。それはあなたが求めているものだと私が思うに、いくつかの答えで質問を後押しすることになります。max_answers


(1):私たちは通常log(N+1)-を取りますので、それも定義さN==0れます。

于 2012-08-09T07:18:05.223 に答える