0

私は、何億もの文字列(varchar(100))といくつかの関連データ(いくつかのint、いくつかのfloatなど)の管理を含むプロジェクトを見ています。プロジェクトオーナーは、これをAmazonクラウドで実行することを義務付けています。

これらの文字列は、バッチジョブを介して継続的に更新されます(1日あたり約1%)。このデータに対して毎日実行されるいくつかの重要なレポートがあります。

SQL Server DBAとしての私の最初の本能は、SQL Serverを実行しているEC2インスタンスに配置することですが、他のオプション(RDS、MySQL、非RDBMSなど)を提示できるようにしたいと思います。

助言がありますか?過去に何があなたのために働いたのですか?

4

2 に答える 2

1

Amazon Cloudには、次のオプションがあります。

  • DynamoDB -KeyValueNoSQLの高度にスケーラブルなデータベース。ほぼ無限の数のキーを保存できます。その2つの使用例は、キールックアップとキー+範囲スキャンを実行することです。レポートに対してより複雑なクエリを実行することはお勧めしません。

  • Redshift-標準のSQLクライアント(PostgreSQLドライバー)に対して機能する大規模なデータウェアハウス。また、列構造でほぼ無制限の行数をサポートできます。その上ですべてのお気に入りのレポートを実行できます。

  • CloudSearch-ファセットの作成に属性を使用する機能を備えた非常にスケーラブルな検索インデクサー(各範囲のアイテム数)。データ構造とクエリタイプによっては、便利な場合があります。

  • RDS -MySQL、Oracle、MS-SQLエンジンをサポートするリレーショナルデータベースサービス。これは、これらのデータベースを標準のEC2インスタンスで実行するのと似ていますが、一部のDBAタスク(バックアップ、復元、スケーリングなど)が簡単に実行できます。

  • EC2-お気に入りのNoSQL(MongoDB、Redis、Couchbase ...)またはRDBMS(PostgreSQL、MySQL ...)を、大量のメモリとディスクを備えた強力なマシンを含む任意のインスタンスタイプに配置します。

于 2013-02-21T18:27:35.390 に答える
1

これはおそらく、あなたがそれで何をしたいのかということになります。RDS は、管理された SQL Server、Oracle、または Mysql にすぎません。ただし、サポートされる機能にはいくつかの制限があります。

マスター ストレージの場所としてではなく、準備されたレポート データを保存できる場所に、NoSQL システムから何らかのメリットが得られる可能性があります。

レポートで使用するデータを操作するために EMR を使用する場合があります。

于 2013-02-19T17:22:22.633 に答える