さまざまな企業が、「いいね」/「ビュー」/「リツイート」などの数をカウント/インクリメントする方法、または同様のものを大規模に解決する方法について、いくつかの洞察を得たいと思います。
月間アクティブ ユーザーが 5,000 万人を超えるユーザーベースでは、Redis と Cassandra の両方が userId のセットを格納して、セットのカーディナリティ (たとえば、ビューアーの数) をすばやく取得するために使用されているのを見てきました。これらのソリューションには欠点がありますが、うまく機能し、スケールアウトできます。ただ、この場合、他のお店は何を使っているのか気になります。
具体的には、次のソリューションを実行します。
- セット、またはその他のデータ構造を使用しますか、それとも単純なキーと値だけを使用しますか?
- 正確な数か、おおよその数か?
- インメモリのみですか、それともハイブリッドですか?
- オープンソース ソリューションですか、それとも自家製ですか?
- その上にハイパーログログの推定を備えた軽量のセットのみのストレージシステムを構築した人はいますか?