1

私は PHP 評価システム (1-5) を持っています。このシステムでは、一部の審査員がいくつかの製品を評価します。これらの製品の結果が公正であることを望みます。通常、一部の審査員は非常に厳しく、製品を 1 ~ 2 の範囲でしか評価しないことがあります。一部の審査員は、製品を 4 ~ 5 の範囲でしか評価しません。1~5の間で正しく判断する人もいます。

審査員の評価をスケーリングして製品スコアを計算する平均審査員のアルゴリズムを作成する際に、誰かがアイデアを提供したり、助けたりすることはできますか。

私はすべての製品の審査員のスコアを平均することを考えましたが、前進する方法か、公平な結果を得るために別の良い選択肢があるかどうかです.

編集

評価システムは、e コマース アプリケーション用ではありません。ここでは、すべての製品を評価する 10 人という少数の審査員しかいません。製品は、たとえばコンテストの曲である場合があります。裁判官の中には、非常に厳格な人もいれば、非常にリベラルな人もいます。いくつかのコンテストがあるかもしれないので、他のコンテストでも非常に厳格でリベラルな審査員の評価を記録し、ルールを設定する必要があります。

4

3 に答える 3

0

切り捨てられた平均はどうですか?ここにアイデアの良い説明があります。

編集

次のような投票があるとしましょう: [1,4,3,2,5,1,1,3,2,4].

配列を昇順で並べ替える必要があり、次のようになります[1,1,1,2,2,3,3,4,4,5]

3次に、投票の 25% (切り上げ)を取り除きたいとしましょう。左と右から 3 票を捨てるだけで、[2,2,3,3].

次に、算術平均を使用して を取得します2.5

編集2

データベース スキーマによっては、データベースにクエリを実行して、投票を昇順で返すことができます。次に、パーセンテージを計算し、使用して(ドキュメントarray_slice()を読んでください)、算術平均を計算することは、今のところあなたの関心事ではありません。

于 2012-04-17T20:41:31.857 に答える
0

簡単に言えば、典型的な投票の範囲に基づいてジャッジに重みを割り当てます (注意してください、彼らはこの重みを認識してはなりません。そうしないと、システムがオフになります)。常に単一のスコアに投票するジャッジは、最も低い重みを取得します。 . 物事に幅広いスコアを与えるジャッジは、より正確であると見なされます。

これはまた、これらの審査員が公正な範囲の品質で製品を審査することを前提としています。したがって、彼らに良い製品または悪い製品をたくさん与えて、さまざまな投票レベルを期待すると、それは非現実的かもしれません.

あなたが探しているのは、投票の標準偏差が最も高い (変動が最も大きい) 裁判官であり、投票の重みが最も高く、最も低い裁判官が最も少ない裁判官です。

非アルゴリズムの解決策は、(本質的に) ジャッジでアルゴリズムを実行し、アメリカン アイドル スタイルのジャッジを選択して、互いにバランスを取り、正確な結果のように感じられるものを取得することです。その場合、標準偏差だけでなく平均投票数にも注意し、標準偏差が広い 1 人、標準偏差が 2 人の狭い人 (リベラルと厳格) の 3 人の審査員を設定して判断する必要があります。それ。このようにして、彼らはより厳格またはより緩いために「声が少ない」と感じることはありません.

繰り返しになりますが、それは彼らがより厳しく/より厳しくする原動力になる可能性があります.製品に対して一貫して簡単すぎたり難しすぎたりすると、彼らは「声を失います」.

于 2012-04-17T20:41:42.437 に答える
0

非アルゴリズムの問​​題にアルゴリズムのソリューションを適用しようとしているようです。一部の「裁判官」が 1 対 2 でしか投票せず、他の「裁判官」が 4 対 5 でしか投票しない理由を考えてみます。

考えられる原因の 1 つは、自己選択である可能性があります。たとえば、オンラインで商品を購入した人は、購入に特に失望した場合や特に満足した場合に、その商品をレビューする可能性が高くなります。これがあなたの問題である場合は、買い物客にもっと投票するように促して、極端ではない経験をした人でも投票に戻ってくるようにすることができます.

別の考えられる問題は、ガイダンスかもしれません。レーティング システムに関するあなたの説明は、審査員にとって明確ではないかもしれません。各評価が何を意味するかの説明を追加してみて、データの品質が向上するかどうかを確認してください。

要約すると、レーティングの問題に対するあらゆる種類の解決策には、「人間」の要素が必要であり、審査員がどのようにレーティングを選択するか、またその理由についての完全なストーリーを考慮する必要があります。入力データの品質が低い場合、ランキング アルゴリズムでできることは多くありません。一方、データの品質が適切であれば、平均を取ることは非常にうまく機能します。

平均を取ることとは無関係の問題の 1 つは、5 つ星の評価が 1 つあるアイテムが、5 つ星の評価が 100 個 + 4 つ星の評価が 1 つあるアイテムよりも上位にランク付けされることです。簡単な解決策の 1 つはラプラス スムージングです。これは、すべての項目を各値 (1、2、3、4、5) の 1 票で効果的に開始することによって問題に対処します。「平滑化された」値は表示しませんが、並べ替え時に使用します。別の解決策については、平均評価で並べ替えない方法の投稿を参照してください。

于 2012-04-17T20:34:26.337 に答える