第四部分 可靠性管理_第1页
第四部分 可靠性管理_第2页
第四部分 可靠性管理_第3页
第四部分 可靠性管理_第4页
第四部分 可靠性管理_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE15第四部分可靠性管理1电子产品可靠性现场统计和综合评价技术1.1引言大型电子信息产品一般特指由数以千计的元器件、零部件、结构件组装而成的具有特定功能的电子设备,如彩电发送系统、微波数据传输系统、气象雷达探测系统、娱乐音像系统……等。它们的特点是:系统较大、技术复杂,机电一体、数字模拟兼备,人和软件共同操作,工作环境条件较差,可靠性和环境适应性要求较高。然而,由于系统体积较大,一般不能安放到试验设备中去做可靠性综合环境应力试验。因此,系统的可靠性定量值不能在实验室测定(鉴定),甚至到了报废之时仍然得不到系统的可靠性定量值。为了解决这个问题,可靠性系统工程研究发展了新的可靠性评价方法,这就是可靠性综合评价技术。可靠性综合评价技术是系统工程综合方法在可靠性工程中的应用,方法的核心是对产品设计生产全过程进行质量可靠性跟踪,对产品进行全寿命的失效统计,用阶段评审资料和统计数据进行综合评价,从而得出产品可靠性定量值。1.2大型电子产品可靠性评价的发展过程大型电子产品的可靠性评价工作,与可靠性系统工程发展历史密切相关,经历了三个发展阶段。①以故障统计为基础的可靠性评价阶段;②按任务剖面进行可靠性统计试验的试验评价阶段;③按可靠性大纲进行阶段可靠性评审(也包括统计试验)加现场失效统计的可靠性综合评价阶段。这里划分成三个阶段,只表明可靠性系统评价的发展过程,而不是评价方法的分割。三个阶段的评价方法可以互相补充,第三阶段综合评价的方法实际上包含了前面两个阶段的方法。无疑,综合评价是最全面最灵活、信息量最多的方法,因而也是最科学、最经济有效的方法。1.2.1以故障统计为基础的可靠性评价方法在人们尚未系统地掌握可靠性科学技术的时期,人们认识大型电子产品的途径是检测性能指标和记录故障。产品的性能指标,大家已经十分清楚,它是产品功能的标志。性能表明产品可以做什么用途,比如彩电发射机的功率,表明它配合什么样的天线之后可以覆盖多大的范围。然而,它是否好用,能否长期不出故障,就要用产品的功能来表示。因此,人们为了保持产品的功能,对故障进行了详细记录,汇集成册,甚至出版故障汇编,供维护者、修理者、操作者参考使用。而可靠性工作者则可以应用故障记录进行可靠性数据处理,获得该产品的平均故障间隔时间:MTBF=T/r(1-1)式中:T=累计工作时间,r=累计故障次数。这便是产品的可靠性观测值,统计学称点估计值。该值客观地定量地反映了产品可靠性平均水平,是工程上能直接得到的定量值,因而是最重要最宝贵的值。这种简单直观评价产品可靠性的方法,虽然产生在第一阶段,但现在仍然受到人们的重视,应用得非常广泛。这里必须强调,系统工作时间的记录要准确。在装有计时装置的设备上做此工作十分方便,对没有计时装置的设备做记录时务必十分用心,每次开机都要记录工作时间。对发生的故障要记录其现象、发生时刻、失效原因、排除措施等内容。这些都可以按照标准表格进行填写。这些表的数据就是可靠性评价的依据,因此必须准确可靠。由此可见,操作人员必须具备严肃认真的工作作风。还必须强调,对故障要有准确的定义,凡进入记录表的应是有规范定义的故障。1.2.2按任务剖面进行可靠性统计试验的试验评价方法迄今,大量可靠性著作和许多标准,都把建立在统计学基础上的统计试验当做最理想的可靠性评价方法。此方法的要点是:试验样品从批量生产的母体中随机抽样指定,其数量一般不少于3台;试验应力尽量模拟实际使用的环境条件──任务剖面;试验时间由选定的试验方案确定。试验方案的要素是:承制方和订购方的风险率α、β,鉴别比D,设定的可靠性验收定量下限值(最低可接收值)θ1,失效判据等。总试验时间与统计试验类型、鉴别比D、拒收相关失效数r有关,请参考表1-1、和表1-2。统计试验类型分为:定时截尾试验、概率比序贯试验、全数试验等3类。定时截尾试验,是预先确定总试验时间和拒收相关失效数的方案,其优点是试验时间试验前便已确定,便于计划管理。试验也可能因相关失效数达到拒收值而提前终止。目前,可靠性鉴定试验,主要采用定时截尾试验的方案。试验后先求出MTBF的点估计值θ=T/r,然后根据使用方风险值β(置信度c=(1-β)×100%)和接收失效数r,在χ2表上查出上下限值的系数,分别与点估计值相乘,便可得到在该置信区间的MTBF上下限值。表1-1:定时截尾试验方案简表(注:19~21为高风险方案)方案号决策风险%鉴别比d=0/1试验时间1的倍数判据(故障数)名义值实际值,,拒收()接收()9101012.09.01.545.0373610102010.921.41.529.9262511202019.719.61.521.518171210109.610.62.018.814131310209.820.92.012.410914202019.921.02.07.8651510109.49.93.09.36516102010.921.33.05.44317202017.519.73.04.33219303029.830.11.58328.52.03.73221303030.733.33.01.110表1-2:序贯试验方案简表方案号决策风险%鉴别比d=0/1试验时间1的倍数判据(故障数)名义值实际值,,拒收()接收()1101011.112.01.5按图判决注:7、8为高风险方案2202022.723.21.53101012.812.82.04202022.322.52.05101011.110.93.06202018.219.23.07303031.932.21.58303029.329.92.0概率比序贯试验,相当于逐次抽样的试验,其特点是,每当试验样品出现相关失效时,必须做出接收还是继续试验的判定。因此,其拒收相关失效数和总试验时间不能在试验前确定,而需在试验中随时进行数据处理(可对照有关标准的判决图),试验的计划管理未知因素多,难度较大。全数试验,主要用于产品可靠性验收试验,特别适用于小批量生产的可靠性验收试验。对任务剖面和生产环境条件接近的产品,如彩色电视机之类的产品很适用。其要点是:每一台产品的试验时间为20~50小时(一般选24、36、48小时),相关失效数的方程表达式为:①接收方程fB=0.72T-3.17(1-2)式中:fB为相关失效数,T为θ1的倍数。当方程相等时,试验继续进行;当方程左边大于右边时,判为接收。②拒收方程fR=0.72T+2.50(1-3)式中:fR为相关失效数,T为θ1的倍数。当方程相等时,试验继续进行;当方程左边大于右边时,判为拒收。式1-2、1-3是根据序贯试验方案3的决策风险α=β=10%和鉴别比D=2处理而成的表达式,其实际风险α'=β'=12.8%。其OC曲线和接收概率随试验时间的变化而变化。表1-3列出了θ1=100小时的判断参数,供参考。表1-3:θ1=100h的产品全数试验有关参数────────────────────────────────────相关失效数(r)拒收T≤θ1的倍数t(小时)接收T≥θ1的倍数样品台数────────────────────────────────────0--4.401--5.792--7.1830.70708.562-342.082089.944-1053.4834811.3411-1764.8648612.7218-25────────────────────────────────────举例:有一批彩电共1000台,其θ1为10000小时,在车间进行全数可靠性验收试验。每台试验24小时,总试验时间t=24×1000=24000小时,在拒收方程中T=24000/10000=2.4(倍),拒收相关失效数fR=0.72×2.4+2.50=4.22(个)。这就是说整个试验允许发生4个相关失效,此时全批产品可靠性验收通过。但是,如果这4个相关失效发生在前10台产品的试验中,此时累计试验时间t=10×24=240小时,T=240/10000=0.024(倍),拒收方程相关失效数fR=0.72×0.024+2.50=2.517,小于4,即4>2.517,因此产品被判为拒收。必须指出,全数试验只能作为验证产品是否达到出厂所要求的可靠性水平,而不能作为可靠性定量值的鉴定或测定的手段。2贯穿于产品研制生产全过程的可靠性综合评价方法另一方面,产品在研制生产过程中共经历了可靠性指标和方案论证、大纲编制、建模分配、设计和可靠性预计、试验和评价等工作阶段。这些都是确保产品达到可靠性定量指标的重要环节,而每一阶段的工作都进行了评审,评审中提出的问题也必须予以解决,否则不批准转入下一阶段的工作。这是现代可靠性管理学的原则。专家们如果把每个阶段的评审资料综合起来分析,便可以全面地系统地给产品的可靠性水平做出高置信度的评价。因此,由可靠性评审可以发展成为可靠性综合评价,而每个阶段的评审及其资料则是可靠性综合评价的基础和依据。如前所述,可靠性鉴定试验是评价产品可靠性定量值最直观的方法,已为人们所接受和应用。但是,这种建立在统计学基础上的评价试验,还有另外的不足之处:1)试验规模较大,试验时间较长,试验费用较高。因此,目前国内外主要是对研制的新产品才进行可靠性鉴定试验。2)鉴定试验的结果代表性较差。我国实行“多研制少生产”的方针后,许多电子信息产品研制批量小,有的大型电子设备研制与生产的批量都相当小,因此可靠性试验的结果代表性较差,承制和订购双方的风险较大,试验的经济效益不显著。众所周知,产品的可靠性工作必须在研制生产的各个阶段进行,如果等到鉴定试验发现产品不能满足合同要求后才采取补救措施的话,将要花费更大的人力和更多的财力物力,会造成严重的浪费。从可靠性的发展过程和我国的实情来看,产品研制生产的可靠性管理主要由本单位的质量管理部门对设计部门实施监控。在产品可靠性评审时,由管理部门组织单位内外的专家实施,往往又以评审代替重点管理,致使管理人员和设计制造人员都十分重视阶段可靠性评审工作。因而,由可靠性阶段评审发展起来的综合评价,其方法可以得到迅速完善,承担可靠性评审工作的专家队伍也在不断地壮大。我们知道,可靠性评审的作用是:运用早期告警的原则,对设计制造的质量进行控制。可靠性评审的目的是:组织与产品有关的各专业的专家对产品所处阶段的结果进行分析、审查,从而揭露可靠性设计上的疑点和薄弱环节,以便提醒管理者在做出决策时注意,并为设计制造者改进产品提示方向。由此看来,可靠性评审加可靠性工程试验,为可靠性综合评价奠定了基础。如果再加上可靠性统计试验或现场试用的可靠性数据,综合评价的结论将会十分可靠。概括起来,可靠性综合评价方法是试验评价方法的补充和发展,是可靠性评审和可靠性试验信息的综合,是科学、公正、经济、有效的先进手段。2.2可靠性工程与统计试验的关系按照设备研制生产的可靠性通用大纲(标准)的规定,可靠性试验包括工程试验和统计试验。工程试验是在产品研制生产过程为了使产品达到合同规定的可靠性定量指标而安排的,它又包括环境应力筛选(英文缩写ESS)和可靠性增长试验二个内容。ESS的方法是:对产品(整机)或部件或元器件施加尽量高的又不会破坏试件的应力(主要施加随机振动和快速高低温循环应力),以便暴露并排除试件的各种缺陷(包括元器件缺陷、原材料缺陷、结构工艺缺陷、设计缺陷),使产品尽快度过早期失效阶段和进入随机失效的工作阶段。可靠性增长试验是产品可靠性增长工作的重要内容。可靠性增长是一个提高产品可靠性设计水平的试验-分析(故障)-改进(设计)-试验(验证)过程。其核心是试验(用于暴露设计缺陷)、改进(消除设计缺陷)、试验(验证改进是否有效)等三个环节。统计试验是建立在统计学理论基础上用于验证某批产品是否达到可靠性定量指标而安排的,它包括可靠性鉴定试验和可靠性验收试验。试验应力采用任务剖面的极端值或直接采用任务剖面。试验样品从产品中随机抽样。试验方案从有关标准中选取,其中要确定承制和采购双方的风险率α、β,最低可接受值θ1,相关失效判据等参数。对于研制产品采用可靠性鉴定试验,而对于批生产产品则采用可靠性验收试验。其试验性质、方法、应力都是一样的。工程试验与统计试验关系十分密切。打个通俗的比方,统计试验好比是考试或运动会的正式比赛,选定了方案后,能否及格或通过,就看最后“一锤子买卖”,而工程试验好比是考前复习或赛前训练,复习得越全面,准备得越充分,考试及格或比赛通过的可能性就越大。工程试验不是可靠性评价试验。但受工程试验的整机环境应力筛选的启发,人们开拓了“可靠性保证试验”。其方法是在整机环境应力筛选的基础上继续做一百多小时的高低温循环试验,如果持续不出故障,则认为产品达到了稳定工作阶段(随机失效期),其可靠性定量值达到了设计水平。这好比是考试或比赛前的摸底考或热身赛一样,能达到什么水平,心中有数。关于可靠性保证试验的有关内容可参阅相应的标准。可见,只要我们认真作好工程试验,确保产品的绝大部分缺陷被消除,其可靠性水平必然较高,然后再做可靠性统计试验,通过的可能性就很大,承制和定购双方都可以放心。对于大型电子产品,限于试验设备的能力,无法在实验室做整机环境应力筛选和可靠性统计试验,可进行分机级的环境应力筛选和可靠性保证试验(分机级可靠性统计试验,会因试验时间过长而难以实施),同样可以收到良好的效果(当然,比整机级的筛选稍差)。顺便指出,研究表明:整机环境应力筛选除了暴露原材料、元器件、结构工艺的缺陷之外,还可以暴露设计缺陷。这正是可靠性增长试验追求的目标。因此,可以在此基础上进行产品可靠性增长工作。这就是说,整机环境应力筛选可以部分兼顾可靠性增长试验。既然整机环境应力筛选有如此之多的作用,人们就应十分重视它,必然要千方百计地创造条件开展此项工作。其基本条件是,要有一定推力的随机振动台和高温变速率的高低温试验箱(温变速率越高越好,应不低于5℃/min)。其方法要点是,按有关标准施加应力,往往要大大超过产品的工作环境条件(大可不必担心会产生过应力损坏),并且要适时加电工作和检测性能指标。按要求,每一台产品都要进行整机环境应力筛选。但当有一定数量的产品经过筛选,记录了一定数量的重复性缺陷模式之后,就可以把试验信息反馈到装配车间,对所有产品进行检查,消除这些缺陷模式,从而免去一部分产品的筛选过程,达到事半功倍的效果。2.3产品全寿命周期的统计信息对可靠性综合评价的作用前已述及,产品可靠性综合评价要应用产品研制生产过程不同阶段的可靠性评审信息,同时也讨论了可靠性评价试验。无论是评审信息还是试验信息,对可靠性综合评价都是十分重要的。从可靠性评价的内涵来看,评价工作应在产品定型之时完成。一般地说,专家们通过阅读审查产品研制生产过程各个阶段的可靠性工作大纲、设计工作笔记和报告、试验记录和报告,便可以做出评价结论。然而,评价的目的不仅仅是给产品发放可靠性鉴定、设计定型、出厂的“通行证”,更重要的是要对产品现场使用的可靠性和维修性负责,即对产品承制和定购双方负责。因此可靠性评价机构必然对产品现场使用的信息也十分重视。因为现场使用信息,一方面可用于对产品全寿命可靠性状态的跟踪,另一方面还可以用于对产品可靠性综合评价结果的验证,为可靠性综合评价积累经验。其实,无论来自产品寿命那一个阶段的信息,就其内容而言,不外乎是来自产品论证现场、设计现场、制造现场、调试现场、试验现场、使用现场的记录资料和数据分析处理的报告。可见,现场的记录资料对产品的可靠性工作是多么的重要!因此,从产品的论证阶段开始直至报废,都要强调做好真实完整的记录。正是这些历史的现实的记录,给我们开展可靠性工作奠定基础,给学者开展可靠性科学研究提供素材,给专家们进行产品可靠性综合评价提供信息,也给承制方和定购方认识产品可靠性水平提供可信赖的数据。3可靠性现场统计工作3.1可靠性现场统计工作的意义和内容上一节论述了现场统计与可靠性综合评价的关系,已经论述了现场统计工作的意义,本节不重复。可靠性现场统计工作的内容,概括地说,就是记录产品从研制生产到报废整个寿命期的与可靠性有关的所有事件,主要记录故障和相应的时间。对不同的工作阶段有不同的重点,以下做简单的介绍。在产品指标和总体方案论证阶段,主要记录和收集产品总体设计书、系统可靠性指标论证书(包含类比产品的有关资料)、可靠性大纲、大纲评审报告等资料。在产品工程设计阶段,主要记录和收集产品可靠性建模、可靠性分配、可靠性分析等报告,以及元器件大纲、电路容差分析报告、可靠性预计报告、可靠性设计评审报告等资料。在产品制造调试阶段,要进行全程记录,主要有:元器件入库检验和筛选报告,车间检验记录,调试记录,分机或整机环境应力筛选(含可靠性保证试验)报告,可靠性增长报告(含故障分析和设计缺陷分析、设计更改文件、验证试验报告),用户使用或试用(含现场故障记录)报告等资料。在定型和批生产阶段,除了生产过程的检验、调试记录之外,要增加鉴定或验收试验报告等资料。在销售和使用阶段,主要记录使用、故障和维护、维修的实况。3.2建立故障审查组织和故障报告、分析及纠正措施系统从可靠性评价的需要出发,有了上一节所列的资料,已经可以完成产品可靠性评价任务。根据这些现场资料,有经验的评审员已可以对产品做出较准确的可靠性评价结论。然而,从工程应用的需要出发,我们不能为评审而评审,而要着眼于提高产品的可靠性水平。我们可以充分应用现场记录的信息资源,通过一个管理机构,为提高产品可靠性水平服务。这个机构就是本节要论述的内容。众所周知,可靠性工作者最关心的是产品的故障。可靠性专家研究的第一对象就是产品的故障。在产品出厂之前,我们希望产品尽量多地把故障暴露出来,以便干净彻底地把它消除掉;在产品出厂之后,我们希望产品尽量少地出现故障,特别不希望发生缺陷型故障(当然随机失效型故障是不可避免的)。为了解决故障问题,有关标准规定建立故障审查组织──这是产品生产和生存期间的经常性机构,要负责处理产品普遍发生的故障;与之相适应地,要建立故障报告、分析和纠正措施系统(FRACAS)──这是在故障审查组织指导下从事故障信息的记录、传递和处理的网络。这个组织和网络由生产和使用方的有关人员组成,其任务是:记录产品现场故障,传递(收集)故障信息,分析发生故障的原因,提出(审查)消除故障(不是修理式的排除故障)的方案,实施消除故障的措施(一般为更改设计),记录并传递故障消除后的效果。在这个组织和网络中,产品的现场使用信息能及时反馈到生产部门,设计更改通知可以及时传递到使用部门,形成一个可靠性增长的闭环系统,维护修理资源也可以及时调济使用。这样就把过去质量“三包”服务上升为全寿命的质量跟踪控制,对提高产品可靠性将十分有效,对于大型电子产品的动态质量管理效果将更为明显。我们希望尽快建立和健全大型电子产品故障审查组织和故障报告、分析和纠正措施系统。3.3故障记录方法和通用表格故障记录的方法,各系统各单位都有自己的经验,也创造了许多好的表格。我们希望能够统一表格,以便于计算机处理。3.4故障模式分析方法本节从工程应用的角度进行故障模式分析,与有关标准的分法不矛盾,但可能有一些差别。为此,我们画出故障树图(见图3-1)。结构工艺材料电路设计结构设计工艺设计缺陷缺陷缺陷缺陷缺陷缺陷元器件缺陷设计缺陷原材料装配工艺缺陷缺陷缺陷型故障偶然失效型故障电子装备故障图3-1电子装备故障原因分解示意按照故障树进行故障分析,过程如下:当产品发生失效时,首先检查操作(含人的直接操作和软件的间接操作)有无错误,排除了操作错误之后,才进入故障分析。我们按发生故障的原因和机理把故障分为随机失效型和缺陷型两大类。随机失效型故障往往找不到明显直接的原因,要靠进一步的失效物理分析才能下准确的结论。对某些缺陷型故障,有经验的专业人员多数可凭肉眼判断。例如经过随机振动后发生断线故障,往往属于装配工艺和原材料缺陷,其原因有:引线过细、焊接不牢、捆扎位置不当、胶粘不牢等,是较容易判断的。当发生了元器件故障时,存在着随机失效、设计缺陷、元器件缺陷等三种可能,需要通过测试,甚至进行失效物理分析才能分辨确定。此时我们可以从统计该故障的重复性来做出下一步的判断。如果在多台产品上都发生过该故障,说明其必然性很大,可以排除随机失效,此时,需分析是元器件缺陷还是设计缺陷。接着检查元器件进厂测试和筛选记录,如果筛选应力符合要求,该种元器件筛选淘汰率并未超标,就又可以排除元器件缺陷,此时可认为最大可能是设计缺陷。此后要检查设计的电路参数,看降额系数选取是否合理?热设计是否恰当(元器件是否因过热烧坏)?如有不当,就得借助电子显微镜和其它先进手段进行“微观分析”,其分析报告可以提供准确的结论。对元器件的各种失效原因也就可分析清楚了。3.5可靠性增长措施及其验证如前所述,可靠性增长措施是针对产品设计缺陷而采取的设计更改。这种更改不仅不能降低产品的性能指标,而且应该能有效地根除该缺陷引起的产品故障(从全面地认识可靠性增长特征来看,消除设计缺陷和降低该电路元器件的失效率都可能达到可靠性增长的目的)。可见,这也是消除产品某些故障的重要手段。消除设计缺陷的措施大体有:增大降额系数,提高元器件对环境应力的承受能力,因而降低该元器件的失效率;重新选取高档次参数的元器件,取代失效品,此时产品成本会增加;改进结构设计,使热场分布趋向合理,减少元器件的局部受热;改进工艺设计,使所有元器件和零部件安装牢靠等。这些措施一经采用,就要更改设计文件,并要落实到所有同批产品之中。这些措施是否有效,通常要经过试验来验证。当没有条件按照产品任务剖面进行验证试验时,可安排在使用现场进行验证。验证的试验数据要按现场记录要求进行整理和传递。3.6可靠性现场统计数据处理方法产品的可靠性现场统计数据处理要做两项工作。一是及时填写故障记录表,按故障报告、分析及纠正措施系统的网络传递给产品故障审查组织(秘书处),以便及时审查;二是进行产品可靠性水平定量计算处理。定量计算处理的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论