第1章 机械失效与可靠性
1.1 机械零部件的典型失效形式
机械零部件的典型失效形式有变形、断裂、腐蚀、磨损等,其中多数失效形式具有渐进性和累积性。零部件在服役过程中性能逐渐退化,机械设计必须保证产品在规定的寿命期内保持足够的强度、刚度等性能指标,保证产品能够安全、可靠地实现预期功能。只有在正确认识和恰当考虑了所有潜在失效形式的前提下,才有可能设计出既满足用户要求又具有市场竞争力的产品,有效地避免在使用中发生意外失效。设计人员要及早认识到潜在的失效机理与失效形式、采用适当的设计准则,就必须熟悉这些失效形式发生的场合及导致这些失效的内部因素和外部条件,需要应用有效的分析方法、正确的失效判据与合理的设计准则。
1.1.1 静载失效
静载荷作用下的失效主要是静强度失效。静强度失效是指零部件在静载荷作用下发生了过大的变形或断裂。机械零部件在工作中一般都要承受载荷,为保证设备正常运行,要求其零部件必须具有足够的强度、刚度、塑性、韧性等。相应地,用屈服强度、断裂强度、断裂韧性等指标表征金属材料抵抗载荷的能力。
机械结构及零部件受载荷时会导致尺寸和形状发生变化,进而改变结构零部件之间的相对位置或配合关系,引起附加载荷和振动。
金属材料在高温环境下长期受载时变形会逐渐增加,即发生蠕变。蠕变引起的结构零部件尺寸变化会导致零部件的预应变或预应力松弛。例如,高温压力容器的预应力螺栓使用一段时间后由于螺栓蠕变而松弛,会导致螺栓连接失效。
受压细长杆状零件还有稳定性问题。当压缩载荷达到某一临界水平时,载荷的微小增加就会使得零件挠度突然增大,导致失稳,发生屈曲失效。
1.1.2 疲劳失效
工程实际中多数机械零部件承受的载荷都明显地随时间变化。零部件在循环载荷作用下,局部高应力部位性能逐渐退化、损伤逐渐累积,在一定载荷循环次数后形成裂纹,并在后续载荷作用下持续扩展直到完全断裂的现象,称为疲劳断裂或疲劳失效。疲劳失效有如下特点。
①低应力。在循环应力的最大值远低于材料的强度极限σb,甚至远低于材料的屈服极限σs的情况下,只要载荷作用次数足够多,就可能导致疲劳失效。
②宏观脆性。不论是脆性材料还是塑性材料,疲劳断裂一般都表现为低应力脆断,即疲劳断裂在宏观上多表现为无明显塑性变形的脆性断裂。
③累积性。静强度失效是在一次大载荷作用下发生的失效;疲劳失效则是在循环应力多次反复作用下,经历一定的服役时间后,损伤累积到一定程度时发生的失效。
④敏感性。零部件对静强度失效的抗力主要取决于材料本身;而对疲劳失效的抗力还对零件形状、表面状态、环境条件等敏感。
⑤断口特征。在疲劳失效的断口上,存在疲劳源、疲劳裂纹扩展区(平滑、波纹状)和瞬断区(粗粒状或纤维状)等形貌不同的几个部分。
1.1.3 腐蚀失效
腐蚀失效是由于腐蚀环境引起零部件材料与腐蚀介质的化学或电化学反应,导致材料表面或内部性能及形貌变化,以至零件不能实现预期功能。腐蚀的表现有多种不同的形式,且经常与疲劳或磨损相互作用。直接化学侵蚀,是暴露在腐蚀环境下的机械零件表面腐蚀,腐蚀均布在整个暴露表面,是最常见的腐蚀类型;间隙腐蚀局限于间隙或裂纹处,这些部位容易驻留微量腐蚀性溶液,因此发生腐蚀;点蚀是一种局部腐蚀,表现为穿入金属的一些孔洞或凹坑;晶间腐蚀是发生于晶界的局部腐蚀,能导致材料强度明显降低。
应力腐蚀是腐蚀环境下的机械零件受应力作用产生裂纹(通常沿着晶界)。应力腐蚀是一类非常重要的腐蚀失效形式,有些材料容易发生应力腐蚀失效。
腐蚀疲劳是腐蚀环境与循环载荷共同作用下的失效现象。在这种情况下,腐蚀和疲劳存在复杂的交互作用。
1.1.4 磨损失效
磨损分为黏着磨损、磨料磨损、腐蚀磨损、表面疲劳磨损等多种类型。黏着磨损的发生是因为局部有高接触压力并在接触位置产生焊接,随后运动又导致结合处塑性变形并断裂。磨料磨损是由磨损颗粒引起的,两个硬表面或中间夹有硬微粒的匹配表面相互之间的犁啃、刨削和切削作用会使表面脱落磨损颗粒。当黏着磨损或磨料磨损和腐蚀条件同时存在时,这些过程共同作用,导致腐蚀磨损。表面疲劳磨损是表面滚动或滑动接触时的一种磨损现象,表层下循环剪应力产生微裂纹,微裂纹扩展到表层,产生宏观剥落,形成磨损凹痕。
1.1.5 冲击失效
冲击失效是指零部件在冲击载荷作用下产生了过大的变形或断裂。高速施加的载荷产生的局部应力和应变要比同水平静态载荷产生的应力和应变大很多,这类载荷产生的应力波或应变波可能会导致冲击失效。冲击引起的断裂称为冲击断裂;冲击导致的弹性或塑性变形称为冲击变形;反复冲击产生的循环弹性应变导致接触面萌生疲劳裂纹、并逐渐长大引起磨损失效,称为冲击磨损;两个表面在冲击时由泊松应变或微小的切向速度分量引起微小的相对切向位移,导致微动行为,称为冲击微动;冲击载荷反复作用在机械零部件上引起疲劳裂纹成核和扩展直到疲劳断裂,称为冲击疲劳。
1.1.6 振动失效
设备在工作过程都有一定的速度或加速度,因此工作过程中的振动问题相当普遍。
机械零件振动的特性参数有振幅和频率等。正常情况下,设备或零件的振幅很小,振动对设备的工作特性影响较小;但当设备或零件的固有频率与周期性载荷的作用频率很接近时,会发生共振,导致振幅急剧增大,短期内即可导致零件断裂。
1.2 可靠性及其指标
1.2.1 产品质量
质量是产品满足使用要求的固有属性,也是产品实现其功能的基本保证。产品质量包括性能指标、专门特性、适应性等。产品的性能指标表征其基本功能水平,例如机械零件的强度、刚度、密封件的寿命、阀门的流量、电机的输出功率等。专门特性表征产品保持其规定性能指标的能力,包括产品的可靠性、维修性、安全性等。适应性指其适用范围,对环境、操作的要求,以及人机界面等。
随着现代机电系统的复杂化,可靠性等专门特性变得更加重要。
1.2.2 产品的可靠性
可靠性是产品的质量指标之一,定义为产品在规定条件下、规定时间内完成规定功能的能力。
产品的可靠性是由设计、制造、使用和维护共同决定的。同一产品在不同的使用条件下可靠性不同。例如,同一产品在寒带或热带,干燥地区或潮湿地区,海上、空中等不同的环境条件下工作,可靠性会有很大的差别。
“规定的时间”是可靠性区别于产品其他质量属性的重要特征。一般来说,产品的可靠性水平会随着使用或储存时间的增加而降低。因此以数学形式表示的可靠性特征量一般都是时间的函数。这里的时间概念不限于一般的日历时间,还可以是启动次数、载荷作用次数、运行距离等。
“规定功能”是要明确产品的功能是什么,以及怎样才算是完成规定功能。产品丧失规定功能称为失效或故障。
设计决定了产品的固有可靠性。应用可靠性设计方法,能有效地提高产品质量、降低成本、实现最优化。
机械产品一般是可维修的。一般情况是,不仅要求产品的平均故障间隔时间长,而且还要求维修时间短。产品处于工作状态的时间与总时间(工作时间+维修时间)之比称为产品的可用性或有效性。产品的可用性或有效性是指可修产品维持其功能的能力。
1.2.3 产品可靠性与全寿命周期费用
产品的全寿命周期费用包括研制、生产、使用、维护维修以及报废处置所需的各种费用的总和。
图29-1-1(a)所示为产品的质量(可靠性)与产品的设计、制造成本及使用维护费用之间关系的传统观点。该图显示,提高产品的可靠性,会导致生产成本增加,但使用、维护成本随着可靠性的提高而降低。图中总费用曲线是以上各项费用之和。该图是产品寿命周期费用与其可靠性关系的传统观点的表述。尽管它看起来很直观并在有关质量和可靠性的文献中频繁出现,但却不总能真实地反映总费用与可靠性之间的客观规律。
有许多案例表明,随着可靠性的提高,总费用会持续下降。换句话说,用于可靠性提高方面的费用是一种投资,通常会得到明显的回报。许多经验表明,产品寿命周期费用与可靠性的关系的更为真实的情况如图29-1-1(b)所示。
图29-1-1 全寿命周期费用与可靠性的关系
图29-1-2(a)、(b)所示分别为6σ质量控制理念传达出的传统和现代的成本-质量关系图。图中,σ表示产品质量指标的标准差,各曲线对应的nσ(n=3~6)表征产品的质量属性(nσ表示产品质量指标)在其均值的 ±nσ 内者皆为合格产品。此图说明,产品质量指标的波动(分散性)越小,即合格率越高,产品的成本就越低。而产品质量指标的分散性会随着产品质量的提高而降低。
图29-1-2 成本-质量关系图
1.2.4 寿命均值与方差
产品寿命是一个随机变量。在许多情况下,只需要知道随机变量分布的参数,例如平均值和标准差,就可以确定该随机变量的主要特征。
(1) 寿命均值
寿命均值θ是随机变量样本的算术平均值。工程中,寿命均值通常由一定数量的产品样本的寿命(或称“失效时间”)t1、t2、…、tn按式(29-1-1)估计
(29-1-1)
均值表征随机变量的“中心”位置,但根据较小数量的样本估计出的平均寿命对与其偏离较大的样本值很敏感,一个极短的或极长的样本寿命值会显著影响均值的估计结果。
(2)寿命方差
方差s2表征样本值与母体均值的平均偏离程度,用以衡量随机变量样本之间的分散程度,由式29-1-2计算
(29-1-2)
(3)寿命标准差
标准差s是方差的算术平方根
(29-1-3)
显然,标准差与均值有相同的量纲。
(4)中位寿命(中位数)
把n个产品样本的寿命(失效时间)从小到大排列,正好处于中间位置的寿命值(若n为奇数)或处于中间位置的两个寿命值的平均值(若n为偶数)称为中位寿命。
中位寿命是对应于50%失效概率的寿命值。与平均寿命相比,中位寿命对与其偏离较大的个别样本值不敏感。一个很小或很大的寿命样本不会使中位数发生变化。
1.2.5 平均无故障工作时间
在产品的寿命指标中,最常用的是平均寿命。可靠性术语中,对于不可修复的产品,平均寿命是指产品失效前有效工作时间的平均值,记为MTTF(mean time to failure)。对于可修复的产品,平均寿命指的是其平均无故障工作时间,记为MTBF(mean time between failures)。图29-1-3为平均寿命与样本寿命之间的关系。图中每条带有箭头的线段代表一个产品从开始投入使用或修复后再次投入使用到发生故障时的工作时间。
图29-1-3 平均寿命与样本寿命之间的关系
1.2.6 产品寿命分布与可靠度
产品的可靠度是其在规定条件下、规定时间内,完成规定功能的概率,记为R(t)。显然,可靠度是时间的函数,故R(t)也称为可靠度函数。
若产品寿命t的概率密度函数为f(t),则该产品工作到时刻t的可靠度(产品寿命大于t 的概率)为
(29-1-4)
与之对应,产品失效概率F(t)定义为
(29-1-5)
显然有
R(t)+F(t)=1 (29-1-6)
随着服役时间的增加,不维修产品的可靠度R(t)单调下降,失效概率单调上升。
可靠度与失效概率的统计意义可表述如下:设有n个产品样本(概率意义上属于同一母体),工作到时刻t时有n(t)个失效,则
(29-1-7)
(29-1-8)
f(t)的统计表达式为
(29-1-9)
式中,Δt为时间增量。
1.2.7 失效率
失效率也称故障率,定义为工作到时刻t时尚未失效的产品,在时刻t以后的单位时间内发生失效的概率。失效率常用λ表示,由于失效率一般也是时间t的函数,因此记为λ(t),称为失效率函数,有时也称为故障率函数或风险函数。
根据定义,失效率是在时刻t尚未失效的产品在随后的单位时间内发生失效的条件概率,即
(29-1-10)
其观测值为,在时刻t以后的单位时间内发生失效的产品数与工作到该时刻尚未失效的产品数之比
(29-1-11)
例如,100个产品工作到80h时尚有60个未失效,在80~82h内失效2个,估计其在工作时间达到80h时的失效率。这里,n=100,Δt=2,n(80)=100-60=40,n(82)=40+2=42,n(80+2)-n(80)=2,n-n(80)=60,故失效率为
寿命服从指数分布时,失效率为与时间无关的常数。在这种情况下,产品失效率可由式(29-1-12)估计
(29-1-12)
式中 r——观测期内发生的失效次数;
——观测期受观测产品的累积工作时间;
n——观测产品总数;
ti——第i个产品的寿命(在观测期内失效的产品)或观测时间(在观测期内未失效的产品)。
失效率常用单位时间的失效百分数表示,例如%/103h,可记为10-5/h。对高可靠度则用10-9/h为单位。失效率的单位也可以根据“寿命”指标的实际物理意义取为1/km、1/次等。
例如,失效率λ=0.0025/(103h)=0.25×10-5/h,统计意义为10万个产品中,平均每4(1/0.25)h会有一个产品失效。
失效率λ(t)与可靠度R(t)、寿命概率密度函数f(t)有以下关系
(29-1-13)
(29-1-14)
若寿命服从指数分布,即λ(t)为常数λ,可靠度与失效率之间的关系为
(29-1-15)
[例1] 假设某零件寿命服从指数分布。取10个零件在指定服役条件下进行了600h的运行实验,失效情况如下:零件1于75h时失效,零件2于125h时失效,零件3于130h时失效,零件4于325h时失效,零件5于525h时失效,其余零件未发生失效。试求失效率。
解 此例中,共有5个零件在运行试验期内发生了失效,另5个零件试验到600h时仍未失效。因此,零件的总运行时间为
75+125+130+325+525+5×600=4180(h)
失效率为
λ=5/4180=0.001196(1/h)
[例2] 某产品寿命服从指数分布,该产品在169h服役期间,发生了6次故障,产品的运行-故障-维修历程如图29-1-4所示,试计算其失效率。
图29-1-4 产品运行情况示意图
解 根据寿命服从指数分布的产品失效率计算公式,失效率为失效数与工作时间之比。由该产品的运行情况信息可知,在其169h的服役期内,有效工作时间为
20.2+6.1+24.4+35.3+5.3+46.7+4.0=142(h)
故失效率为
注:在故障率的计算中,只考虑工作时间,而不涉及因故障及维修所耗费的停机时间(本例停机时间总计为2.1+7.1+4.2+1.8+3.5+8.3=27h)。
图29-1-5所示的失效率曲线,因其形状也被称为“浴盆曲线”。浴盆曲线明显地呈现三个阶段:早期失效阶段、偶然失效阶段以及耗损失效阶段。
图29-1-5 失效率“浴盆曲线”
(1)早期失效
在许多场合,产品投入使用的初期失效率较高,且呈现迅速下降的特征。传统观点认为,在这一阶段失效的产品主要是存在材料缺陷、加工损伤、安装调整不当等问题、性能指标偏低的产品。这类失效可以通过加强质量管理有效减少或采用筛选实验等办法在一定程度上予以消除。
(2)偶然失效
在产品投入使用一段时间、早期失效阶段过后,失效率一般在相当长的一个阶段会维持在一个较低的水平。在这个阶段,可以近似认为失效率为常数。传统观点认为,产品在这个阶段发生的失效是偶然失效,是由不正常的使用、维护等偶然因素引起的。
(3)耗损失效
产品投入使用一定时间后,都会进入耗损失效阶段,其特点是失效率迅速上升。这一阶段的失效主要是由老化、疲劳、磨损、腐蚀等耗损性失效机理引起的。
事实上,并非所有产品的失效率曲线都可以分出明显的三个阶段。复杂系统的失效率曲线、电子元件的失效率曲线、机械零件的失效率曲线、软件的失效率曲线各有不同的特征。高质量等级的电子元器件的失效率曲线在其寿命期内可能基本是一条平稳的直线。而质量低劣的产品可能存在大量的早期失效或很快进入耗损失效阶段。两种不同产品的典型失效率曲线的形式如图29-1-6所示。
图29-1-6 失效率曲线
1.2.8 可靠寿命与特征寿命
可靠寿命是指对应于指定可靠度R的寿命,用tR表示。对应于可靠度R=50%时的可靠寿命即为前面定义的中位寿命,用t0.5表示。特征寿命是指可靠度R=e-1时的寿命,用表示。
[例3] 某产品的失效率为常数λ=0.25×10-4/h,即寿命服从指数分布,试求可靠度R=99%时的可靠寿命t0.99、中位寿命和特征寿命。
解 寿命服从指数分布条件下,可靠度与失效率之间的关系为
两边取对数
故可靠寿命
中位寿命
特征寿命
1.2.9 维修度
维修度是用来衡量产品维修性的指标。维修度的定义是“对可维修的产品在发生故障或失效后,在规定的条件下和规定的时间(0,τ)内完成修复的概率”,记为M(τ)。
与维修度相关的特征量还有平均维修时间和修复率。平均维修时间MTTR(mean time to repair)是指可修复的产品的平均修理时间。
修复率μ(τ)是指“维修时间已达到某一时刻但尚未修复的产品在该时刻后的单位时间内完成修理的概率”。
1.2.10 有效度
有效度也称可用度,是指“可维修的产品在规定的条件下使用时,在某时刻t具有或维持其功能的概率”。有效度是综合可靠度与维修度的广义可靠性指标。
有效度A为工作时间对工作时间(MTBF)与维修时间(MTTR)之和的比,当工作时间和维修时间均为指数分布时,稳定工作状态下的有效度可表达为
(29-1-16)
式中,λ为失效率;μ为修复率。