本文描述系統性失效和隨機性失效,並介紹它們與硬件和軟件失效的關系。
失效可以被分為兩類:
1)隨機性失效
2)系統性失效
隨機性失效指發生的時間無法確定,但卻遵循概率分布的失效。隨機失效不適用於軟件,只適用於硬件,所以也把它叫做隨機硬件失效 (Random Hardware Failure)。隨機失效由物理原因導致,比如腐蝕、熱應力、老化。因為這些原因的隨機特性,硬件在何時發生隨機性失效是無法預測的,但是遵循概率分布(比如指數分布)。隨機失效的概率分布可以從測試、歷史數據中獲得。因為隨機失效符合概率分布,所我們可以計算隨機失效的發生概率,和風險,即用定量的方法分析隨機失效。
硬件隨機失效的例子:某類型電阻的開路故障的概率為 1FIT,即平均運行 \(10^9\) 小時電阻會發生一次開路故障。但某個電阻何時失效是隨機的,我們不確定。
系統性失效指和失效原因是決定關系的失效。當失效原因發生時,系統性失效就會發生。比如產品按照工作溫度-20℃到80℃設計,實際的工作溫度為-40℃至80℃。那么產品在-40℃環境不工作的失效就屬於系統失效。每當失效原因(指環境溫度-40℃)發生時,失效(指系統不工作)就會發生。
系統失效是系統開發和運行過程中人為失誤造成的,一般是由設計階段的規范錯誤、設計失誤導致。產品生命周期的任何階段都可能產生系統故障,包括需求規范、設計、生產、運行、維保和拆解階段。
因為系統性失效由人為失誤造成,不同團隊的人的經驗、知識、技能都差別很大,所以不能用概率來描述系統故障。
硬件失效包括隨機性失效和系統性失效。簡單硬件的失效主要是隨機性而非系統性。隨着硬件復雜度的增加,比如基於微處理器和特殊應用集成電路(ASIC)的控制器,系統性失效會增加。
所有的軟件失效都是系統性失效。從統計上預測系統故障的概率是不可能的,因此對於軟件來說,定量分析相關風險是不可能的。目前證明軟件系統風險可接受的方法都是軟件開發遵循了標准推薦的流程。比如ISO26262推薦用於功能安全系統的C語言程序應該滿足MISRA-C。
硬件 | 軟件 | |
---|---|---|
系統性失效 | √ | √ |
隨機性失效 | √ | × |
例子:
硬件系統性失效: 規范錯誤(比如系統工作溫度范圍)導致的在過低溫度環境下ECU計算結果不正確。
硬件隨機失效:電阻開路失效;因為存儲器1個位反轉而導致的ECU計算結果不正確。
軟件系統失效:越界數組訪問;除零
軟件隨機性失效: 無此類失效。
版權聲明: 本文為作者原創,未經許可禁止轉載。原文地址:https://www.cnblogs.com/byronsh/p/system-and-random-faillure.html
本文的數字簽名如下:
MGUCMQD8+RKEqrRo/yKm79PqnPBejUSGqhx0CfjpHLksMcGoX9jqqbrlTI517Ptjd9FA8A4CMAMi44X/Fc2OaUuqE3Bl9vTLx4DVUWNxTUGIiSyJtGBrZ91NbKLXGIh8rwLoDl2png==
--- 2019-7-20 9:28:37