1

新しいプロジェクト、ビデオ Web サイトに着手しようとしています。ユーザーは登録し、「いいね」や「嫌い」などをクリックして動画に投票できます。いずれにせよ、5 つ星システムではなく、2 オプション投票システムになります。

X 日ごとに、最も人気のある動画の「チャート」を生成します。私の質問は、特定の動画の人気をどのように判断すればよいですか?

再生回数が最も多い動画を集計するルートに行った場合、これは非常に悪い動画がチャートの上位に入るという影響を与える可能性があります (単にそれらが非常に悪いという理由だけで)。

「好き」と「嫌い」の投票数に基づく採点システム (たとえば、100 の好きな投票と 50 の嫌いな投票は 2 のスコアに等しい) のルートに進むと、ビューの少ないビデオが一番上に表示される可能性があります。チャート。

だから、私がする必要があるのは、2つの組み合わせです。もちろん、スパム的な意見や投票は除きます。

この件について、皆さんはどうお考えですか。

編集:次のタグが削除されました: [ mysql ] [ postgresql ]、他のより代表的なタグのためのスペースを空けるため。意図した実装で使用されている SQL テクノロジは、評価モデル自体に関する考慮事項にはあまり関係していないようです。

4

2 に答える 2

5

あなたは、映画の好き嫌いが比較的均質な「投票者」のグループの文脈の中でさえ客観的ではないという点を見逃しているようです。「 ChixFlix 」という用語または「 NetFlix 」と呼ばれるサクセスストーリーが、この主観性をどのように示しているかを考えてみてください...

それでも、提案するモデルの実装に固執する場合は、いくつかの隠れた変数とシステムダイナミクスを確認し、場合によっては評価の式で考慮する必要があります。

  • 投票の3番目の暗黙の値の存在:「投票なし」
    、つまり、誰かが映画のページを表示しても、どちらの方法でも投票しない場合。
    この余分な価値に対処する際の問題は、その曖昧さです。人々は、映画を見なかったため、または映画を本当に好きでも嫌いでもなかったために投票しないのでしょうか。両方の可能性が非常に高いため、式の「投票なしのページビュー」のカウントを使用して、強い(ポジティブまたはネガティブ)感情を生成しない(少ない)映画の評価を(ある程度)高めることができます。 「二極化」映画はより悪名高いまたは人気があるように見えます)
  • バンドワゴン効果特定の
    しきい値を超えると、特にページビューの前に評価や投票数が表示される場合、評価と投票数は、人々が投票を決定する方法(いずれかの方法)に影響を与える可能性があります。その意味するところは、総投票数や視聴回数が実効評価に直線的に関係していないということです。
  • 品質」と「悪名
    の一般的な投票率(「いいね」/「合計」または「いいね」/「嫌い」など)は、映画の「品質」を示します(品質に関する引用符に注意してください)。 。)、これにより、投票数(および視聴回数)は、映画の悪名(「名前認識」など)を示します。
  • 統計的代表
    性非常に少ない投票数や視聴回数は、評価に大きな変動をもたらすため、慎重に扱う必要があります。そうでなければ、小さなサンプルはそれほど静的に代表的な評価にはなりません。
  • 傾向(時間変数)
    モデルを複雑にするリスクを冒して、コレクション内の「ホット」(および「クール」)映画を識別できるように、投票/視聴がいつ発生したかを記録することを検討してください。この情報は、評価ロジックに情報を提供する場合がありますが、ユーザーを現在人気のあるアイテムに誘導するためにも使用される場合があります。ところで、したがって、言及されたバンドワゴン効果を供給します:-(しかし、投票サンプルサイズを増やします:-)。

これらすべての考慮事項は、この評価システムを実装する際の注意を示唆しています。また、映画の完全なセットに関する統計を個々の映画の評価式に含める必要がある可能性があることも示唆しています。言い換えれば、特定の映画をそれ自体の投票/視聴回数だけに基づいて評価するのではなく、たとえば、移動が受け取る平均投票数、映画ページが取得する最大視聴回数などに基づいて評価します。実際、反復プロセス、映画が最初に[大まかに]ランク付けされ、次に同様に評価された映画のグループの統計を使用してランク付けが再計算されると、より良いシステムが提供される可能性があります(式が「公正」で、何らかの形で収束する場合)

于 2010-03-17T17:26:57.440 に答える
1

標準的なトリックは、ニュートラルなベースラインから始めることです。10 の好きなものと 10 の嫌いなものでスコアが 1 になるとします。最初の数票では比率があまり変化しませんが、投票が蓄積されるにつれて、ベースラインは圧倒されます。ベースライン値の正確な選択は、新しい映画の評価 (2 つの値が同じである必要はありません) と、評価を大幅に変更するために必要な投票数に影響します。

于 2010-03-17T18:50:11.490 に答える