計算機系統的可靠性
從它開始運行(t=0)到某時刻t這段時間內能正常運行的概率,用R(t)表示。
失效率
指單位時間內失效的元件數與元件總數的比例,以λ表示,當λ為常數時,可靠性與失效率的關系為: R(t)=е^(-λt),指數分布下近似於1−λt。
平均無故障時間(MTTF)
平均故障修復時間(MTTR)
平均故障間隔時間(MTBF)
計算公式
系統類型 | 可靠性 | 失效率 |
串聯系統 | R=R1×R2×...×Rn | λ=λ1+λ2+...+λn |
並聯系統 | R=1-(1-R1)×(1-R2)×...×(1-Rn) | ![]() |
模冗余系統 | ![]() |
|
1)串聯系統:假設一個系統由n個子系統組成,當且僅當所有的子系統都有能正常工作時,系統才能正常工作,這種系統稱為串聯系統
設系統各個子系統的可靠性分別用R1, R2, R3……, Rn表示,則系統的可靠性
R=R1×R2×R3×……×Rn
如果系統的各個子系統的失效率分別用λ1, λ2, λ3……, λn來表示,則系統的失效率
λ=λ1+λ2+λ3+……+λn
則系統平均故障間隔時間為:
MTBF=1/λ
假設本題三個子系統是串聯的,n=3,R1=R2=R3=0.9,λ1=λ2=λ3=1/10000=0.0001,則:
系統可靠性 R= R1×R2×R3=0.9×0.9×0.9=0.729
系統失效率 λ=λ1+λ2+λ3=0.0001+0.0001+0.0001=0.0003
系統平均故障間隔時間 MTBF=1/0.0003=3333
(2)並聯系統:假如一個系統由n個子系統組成,只要有一個子系統能夠正常工作,系統就能正常工作。
設系統各個子系統的可靠性分別用R1, R2, R3……, Rn表示,則系統的可靠性
R=1-(1-R1)×(1-R2)×(1-R3)×……×(1-Rn)
如果系統的各個子系統的失效率均為λ,則系統的失效率μ為
則系統平均故障間隔時間為:
MTBF= 1/μ
根據本題題意可知,n=3,R1=R2=R3=0.9,λ1=λ2=λ3=1/10000=0.0001,則:
系統可靠性 R = (1-R1)×(1-R2)×(1-R3)=1-(1-0.9)×(1-0.9)×(1-0.9)=0.999
系統失效率 μ = 1/((1/0.0001)*(1/1+1/2+1/3))=6/(10000*11)
系統平均故障間隔時間 MTBF=10000*11/6=18333
軟件可靠性的X個9
X個9表示在軟件系統1年時間的使用過程中,系統可以正常使用時間與總時間(1年)之比,一般都是3~5。
- 3個9:(1-99.9%)*365*24=8.76小時,表示該軟件系統在連續運行1年時間里最多可能的業務中斷時間是8.76小時。
- 4個9:(1-99.99%)*365*24=0.876小時=52.6分鍾,表示該軟件系統在連續運行1年時間里最多可能的業務中斷時間是52.6分鍾。
- 5個9:(1-99.999%)*365*24*60=5.26分鍾,表示該軟件系統在連續運行1年時間里最多可能的業務中斷時間是5.26分鍾。
那么X個9里的X只代表數字3~5,為什么沒有1~2,也沒有大於6的呢?我們接着往下計算:
- 1個9:(1-90%)*365=36.5天
- 2個9:(1-99%)*365=3.65天
- 6個9:(1-99.9999%)*365*24*60*60=31秒
可以看到1個9和、2個9分別表示一年時間內業務可能中斷的時間是36.5天、3.65天,這種級別的可靠性或許還不配使用“可靠性”這個詞;而6個9則表示一年內業務中斷時間最多是31秒,那么這個級別的可靠性並非實現不了,而是要做到從5個9》6個9的可靠性提升的話,后者需要付出比前者幾倍的成本,所以在企業里大家都只談(3~5)個9。