1

新しいプロジェクトを開始し、適切なプラットフォームに関するアドバイスを探しています。現在の考えでは、Hazelcast と AppScale の間で考えています。これは、私たちのチームの結合された (ただし限定的な) 経験が、Hazelcast と GAE の古いバージョンをカバーしていることを考えるとです。どちらも EC2 でセットアップできるようです。これは、予想される CPU 需要を満たす最も簡単な方法かもしれません。

問題のプロファイル

1)。私たちのデータは、日付ごとに保存された多くの小さなレコードで構成されています (ただし、必ずしも時間ではありません)。小さな数値レコード (ビジネス統計、毎日の天気情報や株式市場の価格のように見える) もあれば、分厚いテキスト (ログ ファイル エントリ) もあります。データ量はそれほど大きくなく、1 日あたり 1,000 ~ 50,000 程度です。

2)。計算コストの高い数値モデル (モンテカルロ シミュレーションを考えてください) の非常に多数のインスタンスが、同じデータの固定サイズのウィンドウで常に動作します。

3)。多数の監視エージェントがデータを利用可能にします。

4)。同じデータのより大きな (より長い期間の) セットを 1 日 1 回オフラインで処理する。

Hazelcast を使用すると、受信データをマップに追加し、Executor サービスを使用して共有データ上でモデルを実行します。必要に応じてグリッドへの最小限のフロント エンド アクセスを提供するために、Tomcat を使用する可能性があります。

AppScale では、データ型ごとにテーブルを追加し、タスク キュー API を使用して数値モデルを構成します。フロントエンドを提供するために GAE に従って AppScale にデプロイされたサーブレット。

質問

このような要件には、AppScale または Hazelcast を使用する必要がありますか? つまり、前述の問題について、いずれかのプラットフォームに対して考慮すべき顕著な要因はありますか?

4

1 に答える 1

2

分散型のサービス指向プログラミング モデル (タスクのバッグ) を好む/必要とする場合、答えは AppScale です。並列プログラミング モデル (単一マシンの抽象化) を好む/必要とする場合、答えは Hazelcast です。AppScale は完全なクラウド プラットフォームでもあり (データストアのみではなく)、アプリの進化に合わせてより多くのことを行うことができます。AppScale を使用する場合は、タスクのタイミング制限を調整し、使用したいライブラリでプラットフォームをカスタマイズして、計算コストの高いメソッドに使用できます。

于 2014-09-29T17:58:34.613 に答える