“fault-tolerance”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

573 参照

java - DHTでのノード障害のシミュレーション

私は現在、無料のペストリーDHTを使用していくつかのパフォーマンステストを行っています。Freepastryは、Javaで実行されるオープンソースのDHTです。

目標は、特定の数のノードがダウンしたときのDHTへの影響を監視することです。私の問題は、ノードを削除する最善の方法がわからないことです。現在、各ノードは私のマシンの異なるポートで実行されています。Pastry APIのdestroy（）メソッドを使用してこれらのノードを破棄していますhttp://www.freepastry.org/FreePastry/javadoc21a3/rice/pastry/PastryNode.html#destroy（）

これがノード障害のシミュレーションでは非現実的である可能性があり、tcpkillを使用するなどの別の方法でノードを強制終了する必要があるかどうかが心配です。

Mac OS Xユキヒョウを実行していますが、何か提案を聞きたいですか？

2012-07-27T14:31:20.017

0 投票する

1 に答える

196 参照

replication - フォールトトレラントシステム設計

データストアとしての DB と y (>5) 個の他のマシンがあります。x 分ごとにデータ (更新) を持つマシン A があります。y 台のマシンは x 分ごとにマシン A からデータを取得し、データベース内のデータを更新します。同じことを行うすべてのマシンは、ある程度の耐障害性を備えています。フォールトトレランスを使用した作業をモデル化するクリーンな方法はありますか?

任意のポインタをいただければ幸いです。

replication state-machine distributed-system fault-tolerance

2012-08-02T05:26:02.627

0 投票する

2 に答える

2650 参照

architecture - Erlang/OTP を使用したフォールトトレラントなソフトリアルタイム Web アプリケーションの構築

ピザの配達店向けに、フォールトトレラントなソフトリアルタイム Web アプリケーションを構築したいと考えています。これは、ピザ店が顧客からの電話を受け付け、(CRM Web クライアントを介して) 注文としてシステムに入力し、ディスパッチャーが配達ドライバーを注文に割り当てるのに役立ちます。

これらの目標は特別なことではありませんが、サービスを 24 時間 365 日利用できるようにしたいと考えています。つまり、フォールトトレラントにすることです。さらに、私はそれを非常に速く動作させ、非常に反応が良いようにしたいと思っています.

以下は、そのようなアプリケーションの非常に単純なアーキテクチャビューです。

宅配ピザ注文システム

問題は、Erlang/OTP の優れた機能をすべて使用して、アプリケーションの応答性と耐障害性を高める方法がわからないことです。

ここに私の質問があります：

フォールトトレランスを提供するために、どのシステム要素を複製する必要がありますか?また、その方法は? 各車両のステータス (座標、割り当てられた命令など) を複製された Mnesia データベースに保存できることを知っています。それは正しい方法ですか？
従来の SQL ベース (例: Boss_dbベース) にする必要があるデータストレージサービスと、非常に高速な応答を提供するために Mnesia で実行する必要があるサービスはどれですか? 従来の SQL データベースを使用して、このようなフォールトトレラントで応答性の高いアプリケーションに顧客の記録と履歴を保存してもよいでしょうか?
アプリケーションの応答性を高めるために、すべてのサービス (顧客、車両の状態など) のすべてのデータを RAM に保存する必要がありますか?
永続的な車両データ (ID、容量など) を従来の SQL データベースに保存し、リアルタイムデータ (座標、割り当てられた注文、トランク内の注文など) を Mnesia データベースに保存して、アプリケーションをより多く作成する必要がありますか?リアルタイムレスポンシブ?

architecture erlang real-time erlang-otp fault-tolerance

2012-08-03T06:40:14.010

0 投票する

1 に答える

283 参照

concurrency - 共同リアルタイムアプリケーションでの Erlang の利点

リアルタイムのドキュメント編集およびチャットアプリケーションの作成を検討しています。しばらくの間、Erlang を学びたいと思っていましたが、これは試してみるのに良いプロジェクトではないかと考えていました。

具体的には、Mongrel や LAMP スタックで実行されている Rails アプリと比べて、Erlang のフォールトトレランスと軽量プロセスの利点をどの時点で認識し始めるでしょうか? 100 人の同時ユーザーでしょうか。1,000? 10万？基本的に、新しい言語を学ぶ価値があるかどうか、または現在のスキルセットで十分かどうかはわかりません。ありがとう！

concurrency erlang fault-tolerance

2012-08-29T03:46:40.917

0 投票する

2 に答える

418 参照

java - java.lang.OutOfMemoryError を回避するフォールトトレランスベースのアプローチ

慎重に作成された Java コードの多くが、java.lang.OutOfMemoryError によって無駄にされています。プロダクションクラスのコードでさえ、それによってダウンしてしまいます。

私が聞きたい質問は、このエラーの発生を回避できる優れたプログラミング/アーキテクチャの実践があるかどうかです。

したがって、Java プログラマーが自由に使えるツールは次のようになります。

java.lang.Runtime.addShutdownHook(Thread hook) -- シャットダウンフックにより、正常な終了が可能になります。
java.lang.Runtime.freeMemory() -- VM で使用可能なメモリを確認できます

したがって、私が考えたのは、オブジェクトを作成する前に、メモリを割り当てようとする前にシステムに十分なメモリが残っているかどうかをチェックするファクトリメソッドを記述できるかということです。たとえば、C では、malloc が失敗し、理想的な状況ではなく、メモリー不足であることがわかりますが、単に java.lang.OutOfMemoryError 動脈瘤で死ぬことはありません。

推奨されるアプローチは、より適切なメモリ管理を行うか、メモリリークを塞ぐか、単にメモリを増やすことです。これらは重要な点であることに同意しますが、次のシナリオを見てみましょう。

Amazon マイクロインスタンスで実行しています
VM に割り当てられるメモリはごくわずかで、たとえば 400M です。
Java プロセスはマルチスレッド方式でジョブを処理します。各スレッドは、計算タスクのパラメーターに応じてさまざまな量のメモリを消費します。
私のプロセスにメモリリークがないと仮定しましょう
ジョブが完了する前にジョブを供給し続けると、最終的にはメモリ不足で死んでしまいます
-Xmx を高く設定しすぎると、OS でスワッピングが発生し、スラッシングが発生する可能性があります。
同時実行の上限を設定すると、利用可能なRAMで実行できるジョブの受け入れを制限したり、さらに悪いことに、大量のメモリを必要とするジョブを受け入れたりして、最終的にjava.langにアクセスする可能性があるため、最適ではない可能性があります.OutOfMemoryError とにかく。X.質問の動機を説明するのに役立つことを願っています-標準的な回答は、問題に対するフォールトトレラントなアプローチを求めることと相互に排他的ではないと思います。

前もって感謝します。

java memory-management out-of-memory fault-tolerance

2012-09-27T22:07:12.083

0 投票する

2 に答える

2579 参照

scala - クラッシュの場合に Akka 状態を維持する

私は Akka の初心者ですが、Actors、Agents、Futures など、Akka が提供する非同期プログラミング用の機能の多くを楽しんでいます。

Akka の強力なセールスポイントは、アクターがクラッシュすると、同等のアクターがアクターシステムによって新たに作成され、古いものの代わりにプラグインされるため、強力な安定性が保証されるという事実です。

他のいくつかのシステム (JMS はその 1 つだと言われています) はさらに一歩進んで、アクター間で送信されるメッセージを継続的に永続化します。このようにして、たとえばハードウェア障害が原因でマシンが物理的にクラッシュした場合でも、障害が発生する前の状態に復元することができます。

これは、私が現在開発しているアプリケーションにとって非常に魅力的です。Akka はそのようなメカニズムを提供していますか? そうでない場合、これを実現できるように外部システムと統合する方法はありますか?

scala persistence akka fault-tolerance

2012-10-05T15:05:43.020

0 投票する

1 に答える

2910 参照

message-queue - 分散メッセージキューにフォールトトレランスを実装する

下の図で、中央のメッセージキューが失敗したとします。送信者は、他のメッセージキューを使用して送信されたメッセージを引き続き取得できます。

しかし、メッセージを受信した後にメッセージキューが死んだらどうなるでしょうか。送信者は、メッセージが受信者に送信されたかどうかをどのように認識して、別のメッセージキューで再送信するかどうかを決定しますか?

同様に、メッセージキューがメッセージを配信した後に受信者が死亡した場合はどうなりますか? 送信者は、意図した要求が受信者によって実行されたかどうかをどのように知ることができますか?

ここに画像の説明を入力

message-queue distributed distributed-system fault-tolerance

2013-02-20T03:15:03.603

0 投票する

2 に答える

205 参照

mpi - ホストファイルのノードがダウンした場合、MPI プログラムでクラスターの残りのノードを操作する方法

ホストファイル内のノードがダウンした場合、MPI を使用して残りのノードを処理する方法

mpi fault-tolerance

2013-04-07T09:59:30.040

0 投票する

1 に答える

277 参照

ldap - LDAP フォールトトレランス構成 (SunOne など)

LDAP フォールトトレランス構成 (SunOne など): SunOne LDAP などの LDAP の "フォールトトレランス" を構成する方法を知っている人はいますか。

Google で検索しても有益な結果が得られません。

ありがとう

ldap fault-tolerance sunone

2013-05-20T00:46:32.590

問題タブ [fault-tolerance]

Reference