Twitterは最近、フォロワー数を次の式に入力することで、任意のTwitterユーザーのランクを高精度で概算できることを発表しました。
exp($ a + $ b * log(follower_count))
ここで、$ a=21および$b= -1.1
これは、特定のユーザーのフォロワー数でユーザーのリスト全体を並べ替えるよりも明らかにはるかに効率的です。
別のソーシャルサイトから同様のデータセットがある場合、そのデータセットに合うように$aと$bの値をどのように導き出すことができますか?基本的に、分布がべき法則であると想定される周波数のリスト。