負荷の高いサイトが 3 つあり (1 日あたりのユニーク ビジター数が 40 万人を超える)、それらはすべて緊密に接続され、同じ管理インターフェイスを持ち、ユーザー アカウントを共有しています。サイトには次の統計項目があります。サイト、ページ、地域、国、ブラウザで。統計はサード パーティのサービスによって集計および処理されますが、このサービスではクロスサイトの統計を便利な方法で提供することはできません (多数の手動チェックとユーザーの追跡)。そのため、上記の機能を提供する統計ソリューションを構築し、クロスサイト統計も提供します。そして今、私は疑問に思っています: ストレージには何を使用すればよいでしょうか? まず、古き良き MySQL を使用しようとしましたが、完全に失敗しました。パフォーマンスとスケーラビリティの問題がアイデア全体を台無しにしていました。そのため、NoSQL ソリューションを検討し始めましたが、まだ行っていません。
- ノンブロッキング マップ/リデュース。Map/Reduce は、書き込みのために収集をブロックすべきではありません (したがって、管理者が一部の統計データ サイトを要求した場合でも、訪問者レコードを追加できます)
- 簡単にスケーラブル。
- ユーザーはリクエスト ライフサイクルの開始時にカウントされるため、データベースからのレスポンスは非常に高速です。
何か案は?