11

ウィルソンの信頼区間は、値 TRUE または FALSE、またはそれぞれ「賛成票」と「反対票」を引数として取ります。これらの投票から、評価が生成されます。

私のプロジェクトの目的には、WCI は完璧だと思います。ただし、スカラーの賛成票と反対票は、私が評価しているものを説明するのに十分ではありません.

そこで 5 つ星評価の出番です。ここで誰かに私の論理を反証してもらいたいのです。今、私が考えているのは、WCI で 5 つ星の評価を実装する場合、信頼区間の内部をハッキングすることなく、次のように動作するはずです。

評価ウィジェットの星ごとに、一意の整数値を割り当てます。各値は、肯定 (賛成) または否定 (反対) としてカウントされます。したがって、次の値は次のようになります。

1/5 スター: -2 2/5 スター: -1 3/5 スター: 1 4/5 スター: 2 5/5 スター: 3

上記の値を要約します。1 つ星の最小投票は、2 つの反対票として分類されます。2 つ星の投票は 1 つの反対票として分類されます。星 3 つ​​の中程度の投票に対して、1 つの賛成票を与えます。4 つ星の場合、2 つの賛成票を投じます。そして、最大 5 つ星の場合、3 つの賛成票を投じます。

この論理を反証してください、なぜこれがうまくいかないのですか? 星評価制度の「一般人の理解」に反するのではないでしょうか?

4

3 に答える 3

4

マルチランキングシステムをバイナリの「賛成票/反対票」スタイルのランキングに変換する次の「回避策」を考えるのは簡単です (その後、ウィルソンスコアの信頼区間の下限を使用してスコアリングできます)。

人気のある 5 つ星評価システムを持っているとしましょう。したがって、それぞれの値が 1、2、3、4、または 5 の多数の票があります。

これらの評価を賛成票または反対票に「変換」するには、次のルールを使用します。

For star rating -- Add

*     - 0.00 to up votes and 1.00 to down votes (i.e. a full down vote)
**    - 0.25 to up votes and 0.75 to down votes
***   - 0.50 to up votes and 0.50 to down votes
****  - 0.75 to up votes and 0.25 to down votes
***** - 1.00 to up votes and 0.00 to down votes (i.e. a full up vote)

5 つ星の評価を上/下の評価に減らした後、Evan Miller の記事で説明されている通常のスコア計算に進むことができます。

私は統計学者でも数学者でもないので、これが理にかなっているのかどうか、またこのアプローチの問題点は何かを他の人から聞きたいと思います.

于 2015-11-04T16:19:25.533 に答える
2

まず、WCI の背後にある直感とは何かを理解しようとします。または、さらに単純な正規近似間隔 ( http://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval )。

このすべての間隔計算の背後にある直感は単純です。サンプル平均と標準偏差を計算します。間隔は平均値+-z*標準です。

あなたの場合、平均の計算は簡単です。それは評価そのものの平均です。p1 が 1 つ星評価 p2、...、p5 の割合であると仮定します。p1+p2+...+p5 = 1. n 個のサンプルを使用してこれらの統計を計算しているとします。データの平均は 1*p1+2*p2+...+5*p5 です。

データの分散は ( E(x^2)-(E(x))^2 )/n = ( (p1*1^2 + p2*2^2..+p5*5^2) - ( 1*p1+2*p2+..+5*p5)^2 )/n

std = sqrt(var) であるため、正規近似間隔を計算するのは非常に簡単です。これを WCI に拡張する作業をお任せします。

于 2014-01-15T17:44:26.433 に答える