フォールト トレラント ソフトウェア アーキテクチャに関する優れた記事を探しています。おすすめを教えてください。
5 に答える
「リリースイット!」を発見。優れた読み物になること。
Release It! では、Michael T. Nygard が、アプリケーションが直面する過酷な現実に合わせてアプリケーションを設計および構築する方法を示しています。アップタイム、パフォーマンス、および投資収益率を最大化するためにアプリケーションを設計する方法を学びます。
ソフトウェア信頼性工学ハンドブックPDF で読むことができます。ソフトウェアの信頼性の主な原則の 1 つは、フォールト トレランスです。
第 14 章 フォールト トレラント ソフトウェアを参照してください。
リンクダンプ!:)
これらは、冗長性の特定の側面を調査するときにオンラインでいくつかのアイデアを得た (または単に用語のチェックのために) ものです。
- 分散システムのフォールト トレランス手法(IBM DeveloperWorks)
- フォールト トレラント分散システム(ACM)について
- ソフトウェア制御のフォールト トレランス(ACM)
- ビザンチン フォールト トレランス(ウィキペディア)
- 耐障害設計(Wikipedia)
- 耐障害性(ウィキペディア)
ACM にはメンバーシップが必要です。
ソフトウェアでフォールト トレランスを実現する方法は複数あるため、1 つの記事にまとめるのは非常に困難です。これらの原則は、デスクトップ、サーバー アプリケーション、および/または SOA を扱います。また、複数の方法論があり、そのうちのいくつかは、知らず知らずのうちにすでに実行されています。たとえば、例外処理。1 つの記事ですべての概念を掘り下げようとするのは大変な作業です。Google で簡単に検索すると、多くの記事を見つけることができます。
参考までに、OS 全体の自己修復システムについて調査しました。私は、Sun Solaris 10 アーキテクチャーと IBM の Autonomous Computing の調査 ( http://www.research.ibm.com/autonomic/ ) に従いました。
ソフトウェア障害処理技術に関するこの記事では、次のトピックについて説明します。
- タイムアウト
- 監査
- 例外処理
- タスクのロールバック
- 増分再起動
- 投票