問題タブ [disaster-recovery]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1249 参照

backup - Xen仮想マシンの優れたバックアップソリューション?

次の要件を満たすxenサーバーのバックアップソリューションを探しています。

  1. マシンの実行中にバックアップを作成します
  2. 災害時に複雑なインフラストラクチャに依存することなく、使いやすいディザスタリカバリを備えています
  3. あらゆる種類のLinuxおよびWindowsマシンをバックアップできます
  4. 何かが機能していない場合、ある種のメッセージを送信します。すべてを手動で監視したくない

Cognos Backup&Recovery 10仮想エディションを試しましたが、LinuxVMと互換性がありません。私たちが知る限り、Baculaは災害復旧がうまくいかないようです。

私の質問:私たちの要件に適したバックアップソリューションは何ですか?

ご回答ありがとうございます。

乾杯

アルネ

0 投票する
3 に答える
1246 参照

sql - 接続が切断された場合にSQLコマンドを実行しますか?(SQLサーバー)

これが私の架空のプログラムが作る一連のイベントです...

  1. サーバーへの接続を開きます。
  2. UPDATEコマンドを実行します。
  3. 立ち去って、かなりの時間がかかるかもしれない何かをしてください。
  4. 手順2の変更を元に戻す別のUPDATEを実行します。
  5. 接続を閉じます。

しかし、ああ、いや!ステップ3の間に、このプログラムを実行しているマシンは文字通り爆発しました。同じデータベースにクエリを実行している他のマシンは、展開されたマシンがまだ機能していて、何かを実行していると見なします。

私がやりたいのは、接続が開かれたときですが、変更を加える前に、何らかの理由でこの接続を閉じる必要があることをサーバーに通知して、SQLを実行するように指示します。そうすれば、何か問題が発生した場合に、クロージングアップデートが実行されることを確信できます。

(答えを先取りするために、私はテーブル/レコードロックまたはトランザクションを探していません。ここではリソースクレームを実行していません。)

どうもありがとう、billpg。

0 投票する
3 に答える
8918 参照

git - オブジェクトのみから Git リポジトリを復元する

Gitリポジトリのほとんどを削除するためにそれを頭に入れているWindowsボックスがあります(重要な作業検出器を作動させたに違いありません;)。私が残した (見つけることができる) のはオブジェクトだけです。また、オブジェクトのコレクションがどの程度完全かはわかりません。オブジェクトだけから復元することは可能ですか? 私が知る限り、オブジェクト ツリーは無傷です。すべてのパックと緩いオブジェクトが配置されています。Git を納得させるためのメタデータがありません。

0 投票する
1 に答える
24914 参照

sql - T-SQL コピー ログイン、ユーザー、ロール、権限など

データベースのディザスター リカバリー ソリューションとしてログ配布を実装しましたが、T-SQL を使用して、セカンダリ サーバー上のマスター データベースへのすべてのログイン、ユーザー、ロールのアクセス許可などをスクリプト化する方法があるかどうかを知りたいと考えています。 SQL ジョブとして実行するように SQL をスケジュールできますか?

私の目標は、D/R 状況が発生した場合に、各データベースのトランザクション ログをセカンダリ サーバーに簡単に復元でき、孤立したユーザーなどについて心配する必要がないことです。

助けてくれてありがとう!

0 投票する
2 に答える
67 参照

.net - 回復モードを実装するための戦略

Windows アプリケーションがあり、失敗した場合、失敗後に最初に実行するときにデフォルトで「回復モード」に設定したいと考えています。

エラーにフラグを立てて、ユーザーが回復するためにできるさまざまなことに問題はありません。頭痛の種になっているのは、回復モードユーティリティを実際に起動することです。私にはいくつかのアイデアがありましたが、他の誰かがより良い方法に出くわすことを望んでいました.

1) メイン アプリが読み込まれると、最初に行うことは、以前のエラーをチェックしてから、回復モード ユーティリティを起動する場合です。

これに関する問題は、アプリに何か問題がある場合 (可能性が高い)、アプリがまったく起動しないことです。

2) メイン アプリの代わりに、以前のエラーをチェックするユーティリティをユーザーに起動させてから、メイン アプリを起動するか、回復モードに入ります。

これにより、最初のアイデアの問題は解決されますが、ターゲット マシンが非常にロックされており、展開の問題が発生する可能性があります。

回復モードを実装するための他の戦略はありますか?

ありがとう

0 投票する
1 に答える
206 参照

algorithm - 一連の出来事の分析と推論

私の上司は、現在の状態のログは顧客には受け入れられないと言いました。障害が発生した場合、デバイスの多数の異なるモジュールが独自のエラーを報告し、それらはすべてログに記録されます。障害の元の理由は、リストの途中のどこかに埋もれているか、リストに表示されないか (モジュールが損傷しすぎて報告できない場合)、または他のすべてが元の障害に起因する問題を報告し終わった後、かなり遅れて表示される場合があります。いずれにせよ、ログを適切に解釈して実際に何が起こったのかを突き止めることができるシステム開発者以外の人はほとんどいません。

私の現在の仕事は、顧客にわかりやすい障害報告を行うモジュールを作成することです。つまり、過去 3 秒以内に報告されたすべてのイベントを収集し (これは、発生した障害の原因と最後に生じた後遺症の間の最大間隔に相当します)、このデータの魔法の処理を行い、何が壊れていて修正が必要なのか、明確で親しみやすい 1 行にまとめます。

問題は魔法の部分です: 多数の障害レポートが与えられた場合、どのようにして障害の元の原因を突き止めるかです。因果関係の単純なリストはありません。特定の規則性を示す、一般的に発生する一連のイベントがあります。

例:

  • 短絡が検出され、制限付き動作モードになります。制限付き動作ではフォルトが取り除かれません。そのため、緊急状態がエスカレートされ、総出力電力が切断されます。
  • 安全ラインがかかった。接続されてから 3 秒以内に接続されたと報告されたモジュールはなかったため、システム停止の理由として「不明なソースまたは干渉」が考えられます。
  • ほとんどの出力モジュールは、出力電圧を報告しません。約 1 秒後に、電源監視モジュールが電源が切れていることを報告します。これが本来の理由です。
  • 出力モジュールは、すべての出力ラインで出力電圧を報告していません。電源モジュールからの報告がありません。理由は、モジュールから切断された電源ラインです。
  • 出力モジュールは、その出力ラインの 1 つに出力電圧がないと報告します。他の障害は報告されていません。原因はヒューズの焼けです。
  • 出力モジュールは、受信した状態を適用して報告しませんでした。その直後に、制御モジュールが不正な状態または出力ラインを報告します (出力モジュールが状態を適切なタイミングで更新していないことが原因です)。検出された障害によるシステム)。
  • 入力モジュールに障害が発生すると、デバイスはバックアップ フェールセーフ モードに切り替わります。これまで使用されていなかった障害のある出力モジュールがこのモードに移行し、障害モードが重大にエスカレートされます。元の理由は、障害に関する誤検知を報告することが許可されている入力ではなく、操作を中止した壊れたバックアップ出力です。
  • 最後の 2 秒間、出力モジュールからのアクティビティはありません。これは、壊れていることを意味し、障害モードに入る必要があります。

何が原因かに関する包括的なルールのリストはありません。新しい種類の障害が「実際に」発生し、診断および修正されると、ルールが追加されます。それらのいくつかはヒューリスティックです - このエラーがこれらのエラーを伴う場合、障害はおそらくこれです。一部の障害は解決されません。モジュール レポートの簡潔なリストで十分です。あいまいな回答もあり、1 つの症状セットが 2 つの異なる障害を示唆している場合もあります。これは、「保証されたソリューション」というよりも「ベスト エフォート」です。

(過度に一般的で漠然とした)質問:これを解決するにはどうすればよいですか?この種の問題に対する特定のアルゴリズム、方法、または一般化された解決策はありますか? 一般化されたルールセットを作成し、それらと照合する方法は? ソフトマッチングはどうするの?(たとえば、緊急停止の最中に入力モジュールが破損したとします。これは、まったく無関係なイベントであり、無視する必要があります。) 助けてください。

0 投票する
2 に答える
1345 参照

node.js - node.jsは1つのプロセスサーバーですか?

node.jsは1つのプロセスサーバーです。または、Apacheの子プロセスの束をエミュレートできます。それぞれが異なるリクエストを処理し、それぞれが互いに独立しています(また、長期メモリリークを回避するための子プロセスの循環)。
node.jsを使用する場合、それはまったく必要ですか?

0 投票する
1 に答える
7660 参照

sql - postgresでバックアップなしでテーブルを復元することは可能ですか?

バックアップなしでそれを行うことは可能ですか? 1 つのコマンドを元に戻す必要があります。

0 投票する
1 に答える
184 参照

architecture - アーキテクチャをリファクタリングする前の災害復旧計画

私は主にクライアントのバックアップと復旧計画を設計する必要がありますが、もう 1 つの義務は、システム アーキテクチャを変更することになるフェイルオーバーと負荷分散に関してシステムを信頼できるものにすることです。

私は主に、システムをリファクタリングした後にバックアップおよびリカバリ計画を適用するように設計する方がよいと考えています。つまり、リファクタリング後にバックアップおよびリカバリ計画をすぐに設計することです。

事前にそうすると、大きな頭痛の種になると思います。

DR 計画を適用する前に、クライアントにシステムのリファクタリングを提案するのは良い考えだと思いますか?

そうしますか?

ありがとう

0 投票する
2 に答える
2413 参照

amazon-s3 - S3から非常に多くのファイルをダウンロードする

最大200万のファイルを含むs3バケットのディザスタリカバリコピーをセットアップしたいと思います。

Amazonの高い信頼性の約束を信頼しているため、これを自動化する必要はありません。バケット自体を削除するためのバージョン管理とMFAのセットアップを有効にしました。

そのため、バケットの内容を定期的に(手動で)ダウンロードして、オフラインコピーを保持したいと思います。

私はいくつかのS3クライアントを試しましたが、そのような大きなフォルダーを処理すると、それらのほとんどがハングします。

その仕事に適したツールはありますか、それともAmazonのデータエクスポートサービスに頼る必要がありますか(オフラインバックアップが必要になるたびにUSBドライブを送信する必要があります)。

よろしくお願いします!