playframework - クラスター内の Akka アクターの検出

Question

私は最近、Akka とアクターベースのシステムの概念に頭を悩ませようとしています。Akka の基礎についてはかなりよく理解できましたが、クラスタリングとリモートアクターに関してはまだいくつか苦労しています。

Play Framework 2.0 に付属する WebSocket チャットの例を使用して、この問題を説明しようとします。WebSocket を保持し、現在接続しているユーザーのリストを保持するアクターがあります。アクターは基本的に、技術的にも論理的にもチャットルームを表します。これは、単一のサーバーで単一のチャットルームが実行されている限り、問題なく機能します。

ここで、サーバーのクラスター (単一ノードが追加または削除された状態) で実行されている多くの動的チャットルーム (新しいルームはいつでも開閉できる) について話しているときに、この例をどのように拡張する必要があるかを理解しようとしています。現在の需要による）。このような場合、ユーザー A はサーバー 1 に接続し、ユーザー B はサーバー 2 に接続できます。両方が同じチャットルームで話している可能性があります。各サーバーには、イベント (メッセージ) を受信して適切なユーザーに公開する WebSocket インスタンスを保持するアクター (チャットルームごと?) が引き続き存在します。しかし、論理的には、サーバー 1 またはサーバー 2 のいずれかに、現在接続しているユーザー (または同様のタスク) のリストを保持するチャットルームアクターは 1 つだけ存在する必要があります。

できれば「純粋な akka」で、ZeroMQ や RabbitMQ などの追加のメッセージングシステムを追加せずに、これをどのように達成しますか?

これは私がこれまでに思いついたものです。これが意味をなすかどうか教えてください:

ユーザー A がサーバー 1 に接続し、彼の WebSocket を保持するアクターが割り当てられます。
アクターは、アクティブなチャットルームの「チャットルームアクター」が接続されたクラスターノードのいずれかに存在するかどうかを (Router? EventBus? 何か他のものを使用して?) チェックします。そうではないので、何らかの方法で新しいチャットルームアクターの作成を要求し、このアクターとの間で将来のチャットメッセージを送受信します。
ユーザー B はサーバー 2 に接続し、彼の WebSocket にもアクターが割り当てられます。
また、要求されたチャットルームのアクターがどこかに存在するかどうかを確認し、サーバー 1 で見つけます。
サーバー 1 のチャットルームアクターは、指定されたチャットルームのハブとして機能し、すべての「接続された」チャットメンバーアクターにメッセージを送信し、受信したアクターを配布します。

サーバー 2 がダウンした場合、チャットルームアクターをサーバー 2 で再作成するか、サーバー 2 に移動する必要がありますが、これは現在の私の主な関心事ではありません。アクターのこの動的な発見が、Akka のツールセットを使用して、さまざまな基本的に独立したマシンにどのように広まったかについて、私は最も疑問に思っています。

私はかなり長い間 Akka のドキュメントを見てきました。もしそうなら、私に教えてください:-)

score 13 · Accepted Answer

私は、基本的にチャットルームの例の非常に拡張されたバージョンであるプライベートプロジェクトに取り組んでおり、akka と全体の「分散型」思考にもスタートアップの問題がありました。拡張チャットルームをどのように「解決」したかを説明できます。

追加の構成をあまり行わなくても、簡単に複数回展開できるサーバーが必要でした。開いているすべてのユーザーセッション (ActorRef の単純なシリアル化) およびすべてのチャットルームのストレージとして redis を使用しています。

サーバーには次のアクターがあります。

WebsocketSession: 1 人のユーザーへの接続を保持し、ユーザーからの要求を処理し、システムからメッセージを転送します。
ChatroomManager: これは、サーバーのすべてのインスタンスにデプロイされる中央ブロードキャスターです。ユーザーがメッセージをチャットルームに送信したい場合、WebSocketSession-Actor はすべての情報を ChatroomManager-Actor に送信し、チャットルームのすべてのメンバーにメッセージをブロードキャストします。

だからここに私の手順があります：

ユーザー A は、新しい WebsocketSession を割り当てるサーバー 1 に接続します。このアクターは、このアクターへの絶対パスを redis に挿入します。
ユーザー A はチャットルーム X に参加し、絶対パス (私はこれをユーザーセッションの一意の ID として使用します) を redis に挿入します (各チャットルームには「接続」セットがあります)。
ユーザー B がサーバー 2 に接続 -> redis
ユーザー B がチャットルーム X に参加 -> redis
ユーザー B は次のようにチャットルーム X にメッセージを送信します。ユーザー B は Websocket を介してセッションアクターにメッセージを送信し、セッションアクターは (いくつかのチェックの後) アクターメッセージを ChatroomManager に送信します。このアクターは実際に redis (akka のactorFor-method で使用される絶対パス) からチャットルームのユーザーリストを取得し、各セッションアクターにメッセージを送信します。これらのセッションアクターは、WebSocket に書き込みます。

各 ChatroomManager-actorActorRefで、追加の速度を実現するキャッシングを行います。これは、特にこれらの ChatroomManagers がすべてのチャットルームのリクエストを処理するという点で、あなたのアプローチとは異なると思います。しかし、1 つのチャットルームに 1 人のアクターを配置することは、避けたかった単一障害点です。さらに、これによりさらに多くのメッセージが表示されます。たとえば、次のようになります。

ユーザー A とユーザー B はサーバー 1 にいます。
チャットルーム X はサーバー 2 にあります。

ユーザー A がユーザー B と話したい場合、両者はサーバー 1 のチャットルームアクターを介して通信する必要があります。

さらに、(ラウンドロビン) ルーターなどの akka の機能を使用して、各システムに ChatroomManager アクターの複数のインスタンスを作成し、多くの要求を処理しました。

シリアライゼーションと redis を組み合わせて akka リモートインフラストラクチャ全体をセットアップするのに数日を費やしています。しかし今では、redis を使用してそこを共有するサーバーアプリケーションの任意の数のインスタンスを作成できますActorRef(ip+port で絶対パスとしてシリアル化されます)。

これはあなたをもう少し助けるかもしれません、そして私は新しい質問を受け付けています（私の英語についてではありません;）。

score 10 · Accepted Answer

複数のマシンにまたがってスケールアウトするための鍵は、変更可能な状態をできるだけ分離しておくことです。分散キャッシュを使用してすべてのノードの状態を調整できますが、これにより同期が発生し、多数のノードにスケールアウトするときにボトルネックの問題が発生します。理想的には、チャットルームのメッセージと参加者について知っている 1 人のアクターが存在する必要があります。

問題の核心は、チャットルームが単一のマシンで実行されている単一のアクターによって表されている場合、または実際にそのようなルームが存在する場合です。その秘訣は、チャットルームの名前などの識別子を使用して、特定のチャットルームに関連するリクエストをルーティングすることです。名前のハッシュを計算し、数に応じて、n 個のボックスから 1 つを選択します。ノードは現在のチャットルームを認識し、適切なチャットルームアクターを安全に検索または作成できます。

Akka でのクラスタリングとスケールアウトについて説明している次のブログ記事をご覧ください。

http://blog.softmemes.com/2012/06/16/clustered-akka-building-akka-2-2-today-part-1/

http://blog.softmemes.com/2012/06/16/clustered-akka-building-akka-2-2-today-part-2/

score 7 · Accepted Answer

Zookeeper+Norbert を使用して、稼働しているホストと停止しているホストを確認します。

http://www.ibm.com/developerworks/library/j-zookeeper/

これで、チャットルームサーバーファーム内のすべてのノードが、論理クラスター内のすべてのホストを認識できるようになりました。ノードがオフラインになる (またはオンラインになる) と、コールバックを受け取ります。どのノードも、現在のクラスターメンバーのソートされたリストを保持し、チャットルーム ID をハッシュし、リストサイズで変更して、特定のチャットルームをホストするノードであるリスト内のインデックスを取得できるようになりました。1 を追加して再ハッシュして 2 番目のインデックスを選択し (新しいインデックスを取得するまでループが必要)、2 番目のホストを計算して、冗長性のためにチャットルームの 2 番目のコピーを保持できます。2 つのチャットルームホストのそれぞれにチャットルームアクターがあり、チャットルームメンバーである各 Websocket アクターにすべてのチャットメッセージを転送します。

これで、アクティブなチャットルームアクターとカスタム Akka ルーターの両方を介してチャットメッセージを送信できるようになりました。クライアントはメッセージを 1 回送信するだけで、ルーターがハッシュ変更を行い、2 つのリモートチャットルームアクターに送信します。Twitter スノーフレークアルゴリズムを使用して、送信されるメッセージの一意の 64 ビット ID を生成します。次のリンクで、コードの nextId() メソッドのアルゴリズムを参照してください。異なるサーバーで衝突する ID が生成されないように、norbert プロパティを使用して datacenterId と workerId を設定できます。

https://github.com/twitter/snowflake/blob/master/src/main/scala/com/twitter/service/snowflake/IdWorker.scala

これで、2 つのアクティブなチャットルームアクターのそれぞれを介して、すべてのメッセージの 2 つのコピーが各クライアントエンドポイントに送信されます。各 Websocket クライアントアクターで、スノーフレーク ID のビットマスクを解除して、メッセージを送信している datacenterId+workerId 番号を学習し、クラスター内の各ホストから見られる最大のチャットメッセージ番号を追跡します。次に、特定の送信者ホストの特定のクライアントで既に見られたものよりも高くないメッセージを無視します。これにより、2 人のアクティブなチャットルームアクターを介して着信するメッセージのペアが重複排除されます。

ここまでは順調ですね; いずれかのノードが停止した場合でも、生き残ったチャットルームのコピーを 1 つ失わないという点で、回復力のあるメッセージが得られます。メッセージは、2 番目のチャットルームを介して自動的に途切れることなく流れます。

次に、ノードがクラスターから脱落したり、クラスターに追加されたりすることに対処する必要があります。各ノード内で nobert コールバックを取得して、クラスターメンバーシップの変更について通知します。このコールバックで、新しいメンバーシップリストと現在のホスト名を示すカスタムルーター経由で akka メッセージを送信できます。現在のホストのカスタムルーターはそのメッセージを確認し、その状態を更新して新しいクラスターメンバーシップを認識し、特定のチャットルームトラフィックを送信するための新しいノードのペアを計算します。この新しいクラスタメンバシップの確認は、ルータによってすべてのノードに送信されるため、すべてのサーバがいつメンバシップの変更に追いつき、メッセージを正しく送信できるようになったかを追跡できます。

生き残ったチャットルームは、メンバーシップの変更後もアクティブである可能性があります。その場合、すべてのノードのすべてのルーターは通常どおり送信を続けますが、新しい 2 番目のチャットルームホストにも投機的にメッセージを送信します。その 2 番目のチャットルームはまだ稼働していない可能性がありますが、メッセージはサバイバー経由で流れるので問題ありません。メンバーシップの変更後に生き残ったチャットルームがアクティブでなくなった場合、すべてのホストのすべてのルーターが最初に 3 つのホストに送信します。生存者と2つの新しいノード。akka デスウォッチメカニズムを使用すると、すべてのノードが最終的に生き残ったチャットルームのシャットダウンを確認して、2 つのホストを介したチャットトラフィックのルーティングに戻ることができます。

次に、状況に応じて、生き残ったサーバーから 1 つまたは 2 つの新しいホストにチャットルームを移行する必要があります。生き残ったチャットルームのアクターは、ある時点で、新しいクラスターメンバーシップについて知らせるメッセージを受け取ります。チャットルームのメンバーシップのコピーを新しいノードに送信することから始めます。このメッセージは、新しいノードに正しいメンバーシップを持つチャットルームアクターの新しいコピーを作成します。生存者が、チャットルームを保持する必要がある 2 つのノードのいずれかでなくなった場合、廃止モードになります。廃止モードでは、新しいプライマリノードとセカンダリノードへのメッセージのみを転送し、チャットルームメンバーには転送しません。Akka メッセージ転送はこれに最適です。

廃止チャットルームは、各ノードからの norbert クラスターメンバーシップ確認メッセージをリッスンします。最終的に、クラスター内のすべてのノードが新しいクラスターメンバーシップを認識したことがわかります。その後、転送するメッセージをこれ以上受信しないことがわかります。その後、それは自分自身を殺すことができます。Akka ホットスワップは、デコミッション動作を実装するのに最適です。

ここまでは順調ですね; ノードがクラッシュしてもメッセージが失われない、回復力のあるメッセージング設定があります。クラスターメンバーシップが変更された時点で、チャットルームを新しいノードにコピーするためのノード内トラフィックのスパイクが発生します。また、どのチャットルームが 2 つのどのサーバーを移動したかにすべてのサーバーが追いつくまで、ノードへのメッセージのノード内転送の混乱が残ります。システムをスケールアップしたい場合は、ユーザートラフィックが低下するまで待ってから、新しいノードをオンにするだけです。チャットルームは、新しいノード間で自動的に再分配されます。

上記の説明は、次の論文を読み、それを akka の概念に翻訳したことに基づいています。

https://www.dropbox.com/s/iihpq9bjcfver07/VLDB-Paper.pdf

playframework - クラスター内の Akka アクターの検出

3 に答える 3

Related

Reference