さまざまなリンクのクリック ストリームをリアルタイムで処理しようとしています。クリックするたびにデータベースに記録されます。ほとんどのリンクでは、1 分あたりのクリック数はほぼ一定です (たとえば、< 50)。ただし、ほんの一握りの人が 1000 ~ 2000/min を取得しますが、これは短時間だけです。
リアルタイムで実行するのではなく、これらのストリームのデータベース更新を延期してバッチ処理したいので、このようなトラフィックの多いクリック ストリームを見始めた時期を検出したいと考えています。
私は多くのアプローチで遊んでいますが、良い結果はありません。これは、標準的な数学の問題またはキュー管理の問題のように見えます。
助言がありますか?