跳到主要内容

可靠性

从开始运行t=0t=0到某时刻tt,时段内计算机系统能正常运行的概率R(t)R(t)

可靠性三阶段

  1. 开始阶段--稳定期--失效率高
    • 老化筛选
  2. 正常工作期--失效率低
  3. 老化期--元件失效率提高
    • 淘汰该计算机

可靠性&失效率

失效率λ\lambda指单位时间内失效的元件数与总元件数的比例

R(t)=eλtR(t)=e^{- \lambda t}

平均无故障时间

MTRF指两次故障之间系统能正常工作的时间的平均值。

MTRF=1λMTRF=\frac{1}{\lambda}

平均修复时间

MTRF指计算机及从故障到修复平均所需的时间。

可用性

指计算机的使用效率,以系统执行任务时任意时刻能正常工作的概率表示。

A=MTBFMTBF+MTRFA=\frac{MTBF}{MTBF+MTRF}

计算机可靠性模型

串联系统

当且仅当系统中所有子系统正常运行,系统才能正常运行。

  • 可靠性: R=R1R2R3...RnR=R_1R_2R_3...R_n
  • 失效率: λ=λ1+λ2+λ3+...+λn\lambda = \lambda_1+\lambda_2+\lambda_3+...+\lambda_n

并联系统

当前系统只要有一个子系统正常运行,系统就能正常运行。

  • 可靠性: R=1(1R1)(1R2)(1R3)...(1Rn)R=1-(1-R_1)(1-R_2)(1-R_3)...(1-R_n)
  • 失效率: μ=11λj=1n1j\mu = \Large \frac{1}{\frac{1}{\lambda} \sum_{j=1}^n \frac{1}{j}}

N模冗余系统

系统由N个相同子模块和一个表决器组成,表决器把N个子系统中占多数的结果输出。

  • N=(2n+1)N=(2n+1)
  • 可靠性: R=i=n+1N(jN)R0i(1R0)NiR=\sum_{i=n+1}^N\dbinom{j}{N}*{R}_0^i(1-R_0)^{N-i}