メジャーの分布を取得するために、Cassandra でカウンターを使用します。つまり、mysql でのグループ化と同様です。しかし、メジャーの一意の分布が必要な場合は、どうすればよいですか?
Web ページにアクセスするユーザーを毎日配布する必要があるとします。カウンターは非常に便利です。キーは日、値はカウンターになります。しかし、同じ Web ページについて - 一意のユーザー分布が必要な場合、Cassandra を使用してどのように達成できますか?
さまざまな方法で実装できます-書き込み前の読み取り、オフライン処理など。ビットマップ/ハイパーログログカウンターなどについても聞いたことがあります.Cassandraで/で使用できる最も簡単でシンプルなソリューションは、ユーザーの毎日の分布を一意に取得できます. 1 日あたり数百万のイベントがあります。
例:
2013 年 8 月 25 日に言う - これは私のウェブページのヒット数です - user1、user2、user1、user3
2013 年 8 月 26 日 - ユーザー 1、ユーザー 2
2013 年 8 月 27 日 - ユーザー 2、ユーザー 3、ユーザー 4
2013 年 8 月 28 日 - ユーザー 1、ユーザー 2、ユーザー 1、ユーザー 3
私の出力は
2013 年 8 月 25 日 - 3 人のユニーク ユーザー
2013 年 8 月 26 日 - 2 人のユニーク ユーザー
2013 年 8 月 27 日 - 3 人のユニーク ユーザー
2013 年 8 月 28 日 - 3 人のユニーク ユーザー
つまり、日数とユニーク ユーザーの数です。
ありがとう