algorithm - ホットコンテンツアルゴリズム/時間減衰を伴うスコア

Question

私はアルゴリズムと数式を読んで調査し、ユーザーが送信したコンテンツのスコアを計算して、リストの上位にある現在人気のある/トレンドのアイテムを表示していますが、ここでは少し頭がおかしいと認めます。

私が何を求めているのかについていくつかの背景を説明します...ユーザーが私のサイトにオーディオをアップロードします。オーディオにはいくつかのアクションがあります。

再生しました
ダウンロード
いいね
お気に入り

理想的には、新しいアクティビティがログに記録されるたびにオーディオスコアを更新できるアルゴリズム（再生、ダウンロードなど）が必要です。また、ダウンロードアクションは、ダウンロードよりもお気に入りよりも多くのように、再生よりも価値があります。のような。

可能であれば、1週間より古いオーディオをリストから大幅に削除して、新しいコンテンツがトレンドになる可能性を高めたいと思います。

見栄えの良いredditsアルゴリズムについて読んだことがありますが、複数の変数を利用するためにそれを微調整する方法と、約7日後に古い記事を削除する方法について頭を悩ませています。

私たちが興味深いいくつかの記事：

どんな助けでも大歓迎です！

ポール

score 65 · Accepted Answer

Reddit の古い公式と少しの脱落

基本的に、Reddit の式を使用できます。システムは賛成票のみをサポートしているため、賛成票に重みを付けると、次のようになります。

def hotness(track)
    s = track.playedCount
    s = s + 2*track.downloadCount
    s = s + 3*track.likeCount
    s = s + 4*track.favCount
    baseScore = log(max(s,1))

    timeDiff = (now - track.uploaded).toWeeks

    if(timeDiff > 1)
        x = timeDiff - 1
        baseScore = baseScore * exp(-8*x*x)

    return baseScore

この係数exp(-8*x*x)により、希望するドロップオフが得られます。

指数関数的な低下

背後にある基本

スコアが上がるよりも速くゼロになる関数を使用できます。スコアで使用するためlog、線形関数でも乗算できます (スコアが指数関数的に増加しない限り)。

したがって、必要なのは1、スコアを変更したくない限り戻り、後でドロップする関数だけです。上記の例では、次のように機能します。

multiplier(x) = x > 1 ? exp(-8*x*x) : 1

曲線の勾配を緩やかにしたい場合は、乗数を変更できます。

C++ での例

特定のトラックが特定の 1 時間に再生される確率が 50%、ダウンロードが 10%、お気に入りが 0.1% であるとします。次に、次の C++ プログラムは、スコアの動作の見積もりを提供します。

#include <iostream>
#include <fstream>
#include <random>
#include <ctime>
#include <cmath>

struct track{
    track() : uploadTime(0),playCount(0),downCount(0),likeCount(0),faveCount(0){}
    std::time_t uploadTime;    
    unsigned int playCount;
    unsigned int downCount;
    unsigned int likeCount;
    unsigned int faveCount;    
    void addPlay(unsigned int n = 1){ playCount += n;}
    void addDown(unsigned int n = 1){ downCount += n;}
    void addLike(unsigned int n = 1){ likeCount += n;}
    void addFave(unsigned int n = 1){ faveCount += n;}
    unsigned int baseScore(){
        return  playCount +
            2 * downCount +
            3 * likeCount +
            4 * faveCount;
    }
};

int main(){
    track test;
    const unsigned int dayLength = 24 * 3600;
    const unsigned int weekLength = dayLength * 7;    

    std::mt19937 gen(std::time(0));
    std::bernoulli_distribution playProb(0.5);
    std::bernoulli_distribution downProb(0.1);
    std::bernoulli_distribution likeProb(0.01);
    std::bernoulli_distribution faveProb(0.001);

    std::ofstream fakeRecord("fakeRecord.dat");
    std::ofstream fakeRecordDecay("fakeRecordDecay.dat");
    for(unsigned int i = 0; i < weekLength * 3; i += 3600){
        test.addPlay(playProb(gen));
        test.addDown(downProb(gen));
        test.addLike(likeProb(gen));
        test.addFave(faveProb(gen));    

        double baseScore = std::log(std::max<unsigned int>(1,test.baseScore()));
        double timePoint = static_cast<double>(i)/weekLength;        

        fakeRecord << timePoint << " " << baseScore << std::endl;
        if(timePoint > 1){
            double x = timePoint - 1;
            fakeRecordDecay << timePoint << " " << (baseScore * std::exp(-8*x*x)) << std::endl;
        }
        else
            fakeRecordDecay << timePoint << " " << baseScore << std::endl;
    }
    return 0;
}

結果：

これで十分です。

algorithm - ホットコンテンツアルゴリズム/時間減衰を伴うスコア

1 に答える 1

Reddit の古い公式と少しの脱落

背後にある基本

C++ での例

Related

Reference