ZHCAFH5 July 2025 TMS570LC4357-SEP
盡管我們一直在努力盡可能降低隨機硬件故障的可能性或避免出現系統故障,但仍有發生漏檢故障的可能性。快速檢測此類故障并控制其影響非常重要。元件越復雜,集成此類故障的檢測和控制功能就越重要。
強大的自監控功能允許在目標失效率方面做出很小的妥協,但只能在非常有限的范圍內。如果隨機失效過于頻繁,系統需要同時處理多個故障,否則可能最終導致永久重新啟動,從而導致可用性問題。通常,系統一次只能處理一個故障。發生故障的概率必須保持在非常低的水平,才能滿足整體可靠性目標。
自監控和故障管理功能在各個行業之間僅實現部分重疊。
例如,汽車和航天領域確實都存在來自宇宙輻射的單比特和多比特干擾。但是,如果檢測到此類故障,汽車系統通常會通過命令立即停止運行,然后立即檢查(這可能包括調用牽引車)來尋求保持安全狀態。衛星系統必須超越此類安全狀態,必須在沒有任何實際操作交互的情況下,在軌道上自主尋求系統的完全恢復。
快速可靠的故障檢測是各個行業面臨的一個常見挑戰。圖 5-1 顯示了風險緩解的鏈接。
圖 5-1 緩解風險以實現“避免不可接受的風險”的三個鏈路