1

大規模(7桁以上)の分析サーバーを迅速かつ安価に構築する必要があります。

Piwikは簡単な選択ですが、私がこれまでに収集したものでは、Piwikはスケーリングがかなり難しく、負荷を処理するためにかなり重いサーバーを必要とする可能性があります。

私の2番目のアイデアは、すべてをAmazon DynamoDBにプッシュするだけの迅速でダーティなNode.jsサーバーを作成することです。これにより、最初からデータの収集を開始し、後でUIを構築できます。これは、(垂直方向と水平方向に)すばやく作成およびスケーリングできます。しかし、DynamoDBがそのような使用に適しているかどうか疑問に思っていますか?(データの収集、レポートの生成)

4

2 に答える 2

1

Piwikは、月に数百万のページと数十万の追跡されたWebサイトにスケールアップします。彼らのドキュメントを参照してください:http://piwik.org/docs/optimize/および:http://piwik.org/blog/2012/07/piwik-high-scale-performance-report-as-of-july-2012/

于 2012-09-25T01:16:52.983 に答える
1

私は専門的に DynamoDB を使用していますが、あなたのアプリケーションには使用しません。

DynamoDB には実に多くの制約があります。hash_keyそれらの中で、1 つだけ、オプションで 1つを持つことができますrange_key

hash_key特定の使用法の下にグループ化されたアイテムに対していくつかの「分析」を行うことはできますqueryが、実際には特別なことは何もありません。複雑なクエリの場合、scan遅くて費用がかかり、スロットリングによるいくつかの欠点がある EMR を使用する必要があります。

それにもかかわらず、少なくともアプリケーションのプロトタイピング段階では、NoSQL は適切な選択のようです。ただし、代わりに MongoDB をお勧めします。任意の列にインデックスを付けたり、複雑なクエリを実行したりできます。データ スロットリングについて心配する必要はありません。シャーディングとレプリケーションのセットアップは難しくありません。

MongoDB には強力なエコシステムとコミュニティがありますが、DynamoDB はまだ新しいため、まだありません。MongoDB には、DynamoDB と同じくらい迅速にアプリケーションをブートストラップできるようにするオファーもホストされています。

于 2012-09-13T13:47:56.597 に答える