amazon-ec2 - CPUバウンド/ステートフル分散システム設計

Question

私は、多くの CPU バウンドバックグラウンド処理を伴うレガシーシステムへの Web アプリケーションフロントエンドに取り組んでいます。アプリケーションはサーバー側でもステートフルであり、ドメインオブジェクトは、ユーザーが Web ベースのインターフェイスを介して操作するため、セッション全体にわたってメモリに保持される必要があります。各フィルターがサーバー側で実行されるのに 20 ～ 30 秒かかる可能性がある、Photoshop の Web UI フロントエンドのようなものと考えてください。そのため、ユーザーが待機している間、アプリはリアルタイムでユーザーとやり取りする必要があります。

主な問題は、サーバーの各インスタンスが一度に各「ワークスペース」の約 4 ～ 8 個のインスタンスしかサポートできず、一度に数百人の同時ユーザーをサポートする必要があることです。自動スケーリング機能を利用するために、これを Amazon EC2 で構築します。要約すると、システムは次のとおりです。

レガシーバックエンドシステムへの Web アプリケーションフロントエンド
実行されるタスクは CPU バウンドです
ステートフル、ほとんどの呼び出しはある種の RPC になります。ユーザーは、サーバー側のメモリに保持されているステートフルオブジェクトと対話する複数のアクションを実行します。
ほとんどのタスクはセミリアルタイムであり、20 ～ 30 秒間実行し、同じセッションで結果をユーザーに返す必要があります。
amazon aws Auto Scaling を使用する

このようなシステムを分散型にする最善の方法は何だろうと思っています。

明らかに、ブラウザーと対話し、CPU にバインドされたタスクを Web サーバーからバックグラウンド処理を行う一連の専用サーバーに送信するには、Web サーバーが必要です。問題は、私の特定のニーズに合わせて 2 つの層を最適に接続する方法です。

私は rabbitMQ などのメッセージキューシステムを見てきましたが、これらはワーカーノードが単純にキューからジョブを取得して実行し、状態を忘れることができる 1 回限りのタスクを対象としているようです。たとえば、ステップ 1 がノード 1 で開始された場合、同じワークスペースのステップ 2 は同じワーカープロセスに移動する必要があります。

私が目にするもう 1 つの問題は、ほとんどのワーカーキューシステムが、私が扱っているユーザーフィードバックを提供しなければならないシステムではなく、いつでも処理できるバックグラウンドタスクを対象としているように見えることです。

私の質問は、スケーリング可能なシステムを簡単に構築できる、このようなものに対する既製のソリューションはありますか? ご意見をお待ちしております。

score 2 · Accepted Answer

RabbitMQ にはRPC チュートリアルがあります。このパターンを特に使用したことはありませんが、RabbitMQ をいくつかのノードで実行しており、数百の接続と数百万のメッセージを処理できます。監視を少し行うだけで、コンシューマが必要とする以上の作業があることを検出できます。メッセージはタイムアウトすることもできるため、キューが大きくバックアップされることはありません。容量をスケールアウトするには、複数の RabbitMQ ノード/クラスターを作成できます。最初の応答の後に、正しい宛先への 2 番目のメッセージを取得するために必要な情報を含めるように、複数回の RPC を行うことができます。
0MQ には、必要に応じてファンアウトする基本パターンとしてこれがあります。私はこれで遊んだだけですが、コーディングが簡単で、おそらく維持も簡単です（ブローカーは必要ありませんが、ブローカーdevicesを提供できます）。これはデフォルトではスティッキーを処理しないかもしれませんが、それを処理する独自のルーティングレイヤーを作成できるはずです。
これについても HTTP を軽視しないでください。要求/応答、バックエンドノードごとの厳密なスループット、および適切にスケーリングするものが必要な場合は、HTTP が十分にサポートされています。AWS では、自動スケーリンググループの前で ELB を簡単に使用して、フロントエンドからバックエンドへのルーティングを提供できます。ELB はスティッキーセッションもサポートします。

私は RabbitMQ の大ファンですが、これがスコープ全体である場合、HTTP はうまく機能し、他のソリューションよりも AWS で可動部分が少なくなります。

amazon-ec2 - CPUバウンド/ステートフル分散システム設計

1 に答える 1

Related

Reference