私は新しいプロジェクトを始めるつもりです。.NET アプリケーションで数百ギガのデータを処理する必要があります。このプロジェクトについて詳細を説明するのは、まだ非常に早い段階です。概要は次のとおりです。
- 同じテーブルに対する大量の書き込みと大量の読み取り、非常にリアルタイム
- クライアントはデータベース サーバーの拡張を非常に頻繁に要求するため、スケーリングは非常に重要です。
- 予測すると、集計クエリに関して非常に多くの使用が実装される可能性があります
- データの各行には、処理する属性が多数含まれる場合があります
私は解決策として以下を提案/しています:
- 永続性の分散ハッシュ テーブルの並べ替えを使用します (S3 ではなく社内のもの)。
- ノード間の分析プロセスには、Hadoop/Hive ライク (.NET の代替品はありますか?) を使用します。
- ASP.NET/Silverlight での GUI の実装 (必要に応じて多数の ajax 化を使用)
皆さんはどう思いますか?私はここで何か意味がありますか?