• 可靠性、可用性和可維護性

    編輯
    本詞條由“匿名用戶” 建檔。

    可靠性、可用性和可維護性

    編輯

    可靠性、可用性和可維護性(RAS),也被稱為可靠性、可用性和可維護性(RAM),是一個計算機硬件工程術語,涉及可靠性工程、高可用性和可維修性設計。這個短語最初是由國際商業機器公司(IBM)作為一個術語來描述其大型計算機的穩健性。

    設計有更高水平的RAS的計算機有許多功能,可以保護數據的完整性,并幫助它們在沒有故障的情況下保持長時間的可用性。這種數據完整性和正常運行時間是大型機和容錯系統的一個特殊賣點。

    定義

    編輯

    雖然RAS起源于一個面向硬件的術語,但系統思維已經將可靠性-可用性-服務性的概念擴展到一般的系統,包括軟件

    可靠性可以被定義為一個系統在某個給定的時間t內產生正確輸出的概率。可靠性通過幫助避免、檢測和修復硬件故障的功能來加強。一個可靠的系統不會默默地繼續并提供包括未修正的損壞數據的結果。相反,它檢測并在可能的情況下糾正損壞,例如:對于瞬時(軟)或間歇性的錯誤,通過重試操作,否則,對于不可糾正的錯誤,隔離故障并報告給更高級別的恢復機制(可能故障轉移冗余的替代硬件等),或者通過停止受影響的程序或整個系統并報告損壞。可靠性可以用平均故障間隔時間(MTBF)來描述,可靠性=exp(-t/MTBF)。 可用性是指系統在給定時間內運行的概率,即一個設備實際運行的時間占其應該運行的總時間的百分比。高可用性的系統可以用每年停機時間的分鐘或小時來報告可用性。可用性特征允許系統即使在故障發生時也能保持運行。一個高可用性的系統將禁用故障部分,并繼續以降低的能力運行。相比之下,一個能力較差的系統可能會崩潰,變得完全無法運行。可用性通常是指系統預期可用時間的百分比,例如,99.999%(5個9)。 可維修性或可維護性是指系統可以被修復或維護的簡單性和速度;如果修復一個故障系統的時間增加,那么可用性就會下降。可維修性包括在問題出現時輕松診斷系統的各種方法。對故障的早期檢測可以減少或避免系統停機。例如,一些企業系統可以在系統出現系統故障時自動呼叫服務中心(無需人工干預)。傳統的重點是在盡可能不影響正常運行的情況下進行正確的維修。 注意可靠性和可用性之間的區別:可靠性衡量的是系統正確運行的能力,包括避免數據損壞,而可用性衡量的是系統可以使用的頻率,即使它可能沒有正確運行。例如,一臺服務器可能永遠運行,因此有理想的可用性,但可能不可靠,經常出現數據損壞。

    故障類型

    編輯

    物理故障可以是暫時的或xxx的。

    xxx性故障導致持續的錯誤,通常是由于一些物理故障,如金屬電遷移或電介質擊穿。 暫時性故障包括瞬態和間歇性故障。 瞬態(又稱軟)故障導致獨立的一次性錯誤,不是由于xxx性硬件故障:例子包括α粒子翻轉內存位、電磁噪聲或電源波動。
    間歇性故障的發生是由于薄弱的系統組件,例如,電路參數退化,導致可能復發的錯誤。 故障響應 暫時性和間歇性故障通常可以通過檢測和糾正來處理,例如。ECC代碼或指令重放(見下文)。xxx性故障將導致無法糾正的錯誤,可以通過重復的硬件替換來處理,例如,處理器疏散,或將無法糾正的錯誤傳遞給高層恢復機制。成功糾正的間歇性故障也可以報告給操作系統(OS),為預測性故障分析提供信息。

    可靠性、可用性和可維護性

    硬件特征

    編輯

    改善RAS的硬件特征示例包括以下內容,按子系統列出。

    處理器:帶有指令重試的處理器指令錯誤檢測(如結果的殘留檢查),如IBM主機中的替代處理器恢復,或Itanium系統中的指令重放技術。 鎖定運行的處理器,以執行主檢查器或投票方案。

    內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/193162/

    (1)
    詞條目錄
    1. 可靠性、可用性和可維護性
    2. 定義
    3. 故障類型
    4. 硬件特征

    輕觸這里

    關閉目錄

    目錄
    91麻精品国产91久久久久