フォールトトレランス
ふぉーるととれらんす
ひとことで言うと
システムの一部が故障してもサービス全体が継続稼働できる能力・設計思想の総称。
解説
システムの一部に障害が発生しても、全体としてのサービスを継続できる能力・設計思想。冗長化構成により障害箇所を自動的に代替し、利用者に影響を与えずに稼働し続けることを目指す。フェイルセーフやフェイルソフトなどの関連概念と合わせて、システムの信頼性設計の基本となっている。
くわしく解説
フォールトトレランス(Fault Tolerance)は、システムの一部に障害(フォールト)が発生しても、全体としてのサービスを中断なく提供し続けられる能力、またはそのような設計思想を指す。フォールトトレランスを実現するための主な手法として、冗長化(サーバ・電源・ネットワーク機器の二重化・多重化)、自動フェイルオーバー(障害を検知して自動的に待機系に切り替える)、RAID構成などがある。フェイルセーフ(安全状態への移行)やフェイルソフト(縮退運転)もフォールトトレランスの実現形態の一種として位置づけられる。システムの可用性(Availability)を高める中心的概念であり、金融・医療・通信などのミッションクリティカルなシステムで特に重視される。
具体例で考えよう
銀行の勘定系システムでは、サーバ・ネットワーク・電源をすべて二重化し、どこか1点が故障しても別の経路で処理が継続されるよう設計されており、これがフォールトトレランスの実践例。
試験対策ポイント
フォールトトレランス(障害が起きても継続)、フェイルセーフ(安全停止)、フェイルソフト(縮退継続)の3概念の関係と違いを整理する。フォールトトレランスが上位概念であることを理解する。