私は、最もトレンドの高い「記事」をリアルタイムで返す必要があるシステムを開発しています。記事のヒット数。
私の最初の考えは、各記事の番号を保存することでした。ヒット数と時間。次に、この関数を正規化し、成長率を返す一次導関数を計算します。次に、2次導関数を使用して、それがどれだけ成長しているかを知ることができ、特定のしきい値に達した場合->トレンドとしてタグ付けします.
問題は、たとえば一日の終わりに「オフライン」でできることですが、それを継続的に行う方法がわかりません...
Storm のようなものが存在することは知っていますが、これと同じくらい具体的なものを探しています (疑似コードで書かれたアルゴリズム、または一般的な問題ではなく、この問題に取り組む記事)。