失效故障錯誤的定義
失效:系統按要求執行功能的能力的終止,針對的是功能的喪失或者終止
故障:可引起要素或相關項失效的異常情況,分為永久故障和非永久故障
錯誤:指計算的、觀測的、測量的值或條件與真實的、規定的、理論上正確的值或條件之間的差異
軟件可靠性的定義
在規定條件下,規定時間內,軟件不引起系統失效的概率。
軟件系統在規定的時間內以及規定的環境條件下,完成規定功能的能力。
可靠性和可用性
系統可靠性是系統在規定的時間以及規定的環境條件下,完成規定功能的能力,也就是系統無障礙運行的概率
系統可用性是指某個給定時間點上系統能按規定需求執行的概率
提高可靠性需要強調減少系統中斷或故障的次數,提高可用性需要強調減少系統從災難中恢復的時間
可靠性技術
(1)故障檢測,故障定位,故障修復
(2)防錯,查錯,容錯,糾錯
可靠性設計的基本原則
(1)要在軟件的總體設計框架中使用,並且不能與其他設計原則相沖突
(2)前提是滿足提高軟件質量的要求下,最終提高軟件可靠性
(3)確定軟件的可靠性目標,不能無限擴大,並且排在功能,用戶需求,開發費用之后考慮
可靠性的分析方法
失效模式影響分析,嚴酷性分析,故障樹分析和潛在線路分析。
可靠性測試流程
確定可靠性目標,進行軟件運行剖面,編寫測試計划,設計可靠性用例,執行測試,分析測試結果,編寫測試報告。
軟件運行剖面
MUSA軟件分析的原則:
1. 模式剖面:對軟件的使用者進行分類,根據對使用者的划分將軟件划分成不同的模式剖面。
2. 功能剖面:根據每個模式下的功能可以划分為不同的功能剖面。
3. 運行剖面:每一個功能由許多運行組成。這些運行的集合便構成了運行剖面。
定義失效等級
在制定測試計划時,失效及其等級的定義應由測試人員、設計人員和用戶共同商定,達成協議。
定義失效等級的目的:
(1) 對發生概率小但失效后危害嚴重的功能需求的識別。
(2) 對可不查找失效原因、並不做統計的功能需求的識別。
失效等級定義
1級失效:系統無法運行
2級失效:主要功能失效
3級失效:影響一般,范圍較小
4級失效:不影響使用,范圍小
如果存在1級和2級失效可能性,那么就應該進行故障樹分析,標識出所有可能造成嚴重失效的功能需求和其相關的輸入域、外部條件和發生的可能性,對引起1級和2級失效的功能需求及其相關的輸入域必須進行嚴格的強化測試。
對引起3級失效的功能可按其發生概率選擇測試實例。
第4級失效可不查找原因,可在以后的版本中處理。
失效數據
失效時間數據(完全失效數據):每一次失效發生的時間構成的失效數據
失效計數數據(不完全失效數據):由各時間段內發生的失效次數構成的失效數據
故障樹
故障樹的定義
故障樹分析法是在系統設計的過程中,通過對可能造成系統失敗的各種因素(包括硬件、軟件、環境、人為因素)進行分析,畫出邏輯框圖(即故障樹),從而確定系統失敗原因的各種可能組合方式或其發生概率,以計算系統失效概率,采取相應措施,以提高系統可靠性的一種設計分析方法。
對於所研究系統的各類故障或不正常工作情況統稱為故障事件,與之對立的是成功事件。
故障樹是一種為研究系統某功能故障而建立的一種倒樹狀的邏輯因果關系圖。
故障樹主要由事件和邏輯門構成,事件用來描述系統或元部件的故障狀態,邏輯門把事件聯系起來,表示事件間的邏輯因果關系
故障樹的特點
(1)自上而下作層層追蹤分析
(2)事件間的邏輯關系一目了然
(3)在系統設計階段有助於判明系統的隱患和潛在故障
(4)故障樹可作為管理維修人員的管理維修指南
(5)規范化
僅含有基本事件、中間事件、頂事件以及與或非三種邏輯門的故障樹
(6)簡化
用相同轉移符號表示相同子樹、相似轉移符號表示相似子樹
用布爾代數法化簡,去掉明顯的邏輯多余事件和邏輯多余門
故障樹相關過程
(1)選擇頂事件
(2)建立故障樹:規范化、事件邏輯門符號
(3)故障樹的定性分析:簡化(布爾表達式化簡)和求最小割集
(4)故障樹的定量分析:求頂事件發生的概率、重要度分析
(5)確定設計上的薄弱環節(找出問題所在)
(6)采取措施,提高產品的可靠性和安全性
割集的性質(重要度影響關系)
階數越小的最小割集越重要
在低階最小割集中出現的底事件比高階中的更重要
在相同階次下,在不同割集中重復出現次數越多的底事件越重要