1.1 简要历史背景
自1950年代诞生以 来,“可靠性工程”(及其后更全面的“可信性”)已经 成为一个专门的工程学科,它在某些方面与“质量工程”和传统的设 计与生产工程相联系。这种学科的区分也许在几十年前就已得到证实,但在今天 这种区分是否有用则值得质疑。理由是:
l 在1950年代质量是由质量控制部门来管理。一般而言,这些部门不包括可 靠性工程人员,而是由审查员组成。而今天世界级的公司则聘用“明智人 才”对质量进行顶层管理。
l 产品可信性对用户预 期的影响是如此巨大,以至于我们很难相信“可靠性工程”仅仅是 “质量”的一个表亲。质量从更广泛的层面上说,应该包括可信性概 念。对此内部关系有些文章已经给出了很好的描述。
质量和可靠 性工程都利用了统计方法。毫无疑问,可靠性工程采用的一些统计方法不同于质 量工程(如马尔可夫链、框图模型等),而典型的统计质量控制方法(如SPC)也不属于可靠性工程的工具。
1.2可靠性工程统计学作用的发展历程
先驱们把可靠性工程建立在统计学 的基础上。在定义上,可靠性是概率概念,因此统计方法非常有用(波尔的代数 学、概率函数、参数估计等)。这些方法主要用于测量、预计和鉴定可靠性。
随着可靠性数值的提高,这些方法的应用能力下降了。例如,即 使采用了加速因数,验证规定MTBF值所需要的器件数和试验小数 现在已变得不切实际了。对此合乎逻辑的结果是,可靠性工程师对统计学的使用 下降了。
1.3 质量工 程中统计学作用的发展历程
统计质 量控制诞生于1920年代的贝尔实验室。Shewhart 提出的均值和极差图在今天仍在使用(或者误用)。在第二次世界大战期间,美 国国防部(DoD)发布了统计验收抽样计划,后更名为MIL-STD-105和MIL-STD-414。
在1950和60年代,西方企业对SPC和统计 抽样的使用减少了,但日本公司接受了W.E.Deming的思想。 K. Ishikawa领导了这一过程,对工程人员和工人组织进行了大 规模的统计教育计划。这可能是日本企业在某些领域(电子、摄影等)非常突出 的因素之一。
在1980年代,这一过程发生了逆转 ,美国公司看到了日本人在寻找解决问题的“处方”。发现统计学是 日本人成功的原因之一,田口方法被输出到了美国和欧洲。西方公司越来越多地 使用统计方法,但在许多情况下,这种使用仅仅是模仿性的,缺乏最基本的理性 。
问题是,如果统计方法如此有用,为什么西方公司以前要弃之 不用呢?难道他们都是如此无能?难以置信。我个人认为,原因在于所用的统计 方法(主要是验收抽样和控制图)在新的条件下没有效率。当批规模小于#p#分页标题#e#1000,通过抽样来保证不到0.1%的缺陷比例是否高效 率?你会把这一方法用于3.4 ppm吗,这可是目前许多公司的目 标?这听起来就好象以手取水。而且,控制图不能改进Cp指数(即自然过程的变化),最多也就是维持原状。
自1980年代开始,电子计算器和计算机可以较低 的价格提供,这使多年前就已了解但由于计算复杂而无法使用(或很少使用)的 统计方法(ANOVA、DOE、回归分析等)的应用成 为可能。
必须说明的是,有时这些统计方法是“打包或收纳 ”到健壮设计(作为田口方法的延伸,但使用了DOE)、 6σ、Shainin工具、统计思想等方法中。
1.4 今天的目标是什 么
今天的目标不仅是“衡量可 靠性”或“衡量质量”,而是要“改进质量和可靠性 ”。为实现这一目标,上述的方法已经证明在质量特性优化和减少变化方 面是非常高效率的,而这可带来可靠性的改进。
2. 随机失效真的是随机的吗?
由于可靠性与失效有关,因而失效 率被广泛使用。例如,它可以表述为“xxx器件的失效率为 21 FIT”(1 FIT=1个失 效每10-9器件小时数 )。这一数值加上恒定失效率的假设(即可靠性指数分布)可用于预计产品的服 务行为(MTBF、所需备用件等)。
显然这一概念 对于新手来说易带来误导。可能他会以为任何使用的器件都有相同的失效概率, 通过象抽奖一样的游戏来产生失效。但实际并非如此,这种误解使许多工程人员 把统计学视为学术的东西,是与工程理念相违背的。
生产变化是普遍存在的问题,因此“不是所有的部件都生而平等 的”。另外,服务环境也并非相似和稳定。因此失效概率对于所有使用中 的器件来说并不相同。失效器件并不是在俄国轮盘赌死亡游戏中不走运给射中的 人,而是最弱的器件或处于最严酷环境条件下的器件。这与普遍的工程常识完全 一致,并且不违反任何可靠性工程定律。
因此随机变量是 质量特性和环境条件。经典可靠性函数(指数、威布尔、对数正态等)可用于描 述器件整体的行为,但他们对可靠性改进没有多少帮助。
这些问 题说明可通过以下途径实现产品可靠性:
(1) 确定预期功能和使用条件
(2) 基本 设计和失效模式的确认
(3) 选择与此前发 现的失效模式相关的关键内部质量特性并设定其值。也就是说能满足产品寿命期 内可靠性目标的内部质量特性最小值。
(4) 实施控制策略来确保在生产过程中能达到并保持这一内部质量特性值。
这些步骤在任何情况下都不可当作一成不变的“死板的处方 ”,而是要当作通用导则。
3. #p#分页标题#e#在新设计中内建可靠性
3.1 步骤1:确定预期功能与使用条件
一般地这一步骤属于设计或市场部门的责任。在这一阶段建立功能要求与设计和生产问题之间的联系是很有用的。 支持这一联系的一个强有力工具是“质量功能展开(QFD) ”。
3.2 步骤 2:基本设计和失效模式 的确认
在此阶段,经典的FMEA(它不是面向统计的工具)应重点放在失效模式的确认上。这一工 具可用其他我们熟知的老可靠性工具来补充:如FTA和可靠性框 图分析。这3个工具对于组织现有关于新产品的知识以及相关的 材料和工艺过程是很有用的,但由于新知识还没有获得,因此有些失效模式仍然 没有发现。
要获得新知识,科学家建立了与现有数据相吻合的理 论模型或通过实验来产生这些数据。部分因子和其他DOE方法是 进行实验和分析数据获取统计有效结论的高效率途径。
“实验”听起来可能象很昂贵的东西,只局限于高技术或 前沿科学。确实实验要花费一些资源,但廉价和简单的产品通常只需要廉价和简 单的实验。在本文提供的实例中实验可由中等规模的工程部门来承担。
3.3 步骤 3:关键内部质量特性的 确认
虽然数十年来我们已经有了很 好的工程方法,但“健壮设计”这一概念则是由田口提出的。健壮设 计可定义为响应特性对外部因素(如环境条件)和内部特性(如生产变化)不敏 感的设计。
有关田口方法的统计缺陷已经有很多文章加以论述。 无疑健壮设计的概念从工程的角度出发是完全需要的。传统的DOE方法可用于实现这一目标。
显然,这些统计方法如果 没有好的工程判断来支持是没有多少价值的。没有这一判断,就需要用大量的因 子来解决数百个实验。通常这是不可能做到的,有时即便在数学上可行,但费用 却不经济。
一旦确认了内部特性,就必须确定生产容差。对关键 的特性,这一容差必须严格,其他特性则尽可能宽松。确定容差的方法与变化规 律和回归分析有关。
图1 产品响应特性与内部和环境特性
3.4 #p#分页标题#e#步骤4:实施质量控制策略
在进入生产前,可用统计方法来研究容差与关 键工艺变化的比率(在质量过程中称为工艺能力指数Cp和Cpk)。在世界级公司中 (6σ)这一指数的目标为Cp =2.0,Cpk=1.50 ,因此不合格品率为3.4 ppm。当这些工艺的能力不够好时,就 必须减少工艺的变化。
在减少变化的过程中,用得较广的统计方 法是部分因子和ANOVA(用于变化组成分析,以确认主要的变化 源)。
要说明的是,测量是任何过程的一部分, 因此必须具备度量能力(R&R研究)。
图3 关键工艺能力改进(减少变化)
图4 按目标生产和漂移改正
当产品进入生产时,大局已定,能做的已经 很少了。在生产中使用的统计方法是SPC方法(过去的Shewhart图或较现代的CUSUM、EWMA等 )。要说明的是,这些图发现工艺漂移的敏感度大大下降了(如用均值Shewhart图、样品规模n=5,发现 1σ漂移的概率只有20%)。
1. 现有产品的可靠性改进
医药学的历史与人类的病痛一样长。大量医药科学的进步都是建立在 外科医生进行的尸体解剖上。而在我们的专业领域,这一做法通常称为“ 失效分析”。通过失效部件的研究可了解很多东西。每个失效部件都应被 视为进行可靠性改进的机会。失效分析的目标是确认哪些物理特性使失效部件不 同于非失效部件。这一点只要通过观察就可做到,但还必须通过试验来证明。一 个高效率的方法是D. Shainin提出的变量搜索分析。
另一个借用医药学的是流行病调查。这一方法被公共卫生服务部门用 于跟踪疾病的来源(最近的就有“疯牛病”、军团病、巴尔干综合症 等)。在质量专业中这被称为“原因效应分析”。进行这一调查的一 个非常高效率的方法是模仿公共卫生流行病方法的分层数据分析。 #p#分页标题#e#
如果知道了失效部件共同的外部情况(如生产日期、使用环境条件等 ),则失效的解决方法会更接近。要确认失效部件相关的情况,一个非常有用的 简单质量工具是多元分析
可靠性内建 的实际例子
5.1 案例介绍
FMEA表明海滨路灯柱的关键失效模式是“外壳腐 蚀”。因此外壳设计要进行表面电化学保护处理。通过实验室研究确定了 满足合同寿命内无失效的最小厚度。
这一研究是 通过盐雾试验箱和廉价电镀板的加速试验来进行。加速因子的确定没有太大的争 议,因为腐蚀大气即使较严酷也不会使简单的外壳产生新的失效模式(但微芯片 试验的加速因子则不会如此简单)。
显然,必须要明确实 验室报告的厚度是指哪一个(见图5和图6)。如 前所述,随机变量并不是指“一定条件下t时间内会失效的 外壳”,而是“外壳的厚度值”。这一随机变量的变化有3个来源:
图5 最小厚度是多少?最小平均厚度或任何 一点的最小厚度呢?
图6 失效从较弱的点开始
l 批次之间的变化 。反应槽中的化学酸性会随时间而下降,环境温度会变化,污染物还可能掉入槽 中,等等。
l 部件之间的变化 。部件会位于槽的不同区域,等。
l 部件内的变化。部件的几何外形可能很复杂,整个部件的处理不一定均匀, 等。
如果知道了这些变化,就可确定工艺均值,确保任何点都覆 盖有足够厚度的保护层。我们尝试以正态分布和集合来考虑:
μ=最小厚度+3σ (1)
但这有可能是错误的,因为这一工艺有限 制(0,∞),因此应采用有尾部的分布。
槽的化学酸是规定好的,没有其他选择,因此电化学过程只有一个可控制参数( 电流)。虽然是只有一个参数的过程,看起来很简单,但还有另外两个较难控制 的因素(田口的术语为“噪声”)。
l 槽内酸的损耗
l 环境温度。
我们对表示外壳的数据 进行假定来确保可信度。在本例中,最小厚度要求设定值为部件上任何点为 1.000。
5.2 #p#分页标题#e#过程变化特性表征
为确认和鉴定变化来源,加工了两批部件,每批4个。 其中一批加入新的酸,另一批的酸保持正常水平。电流固定在65 (旋钮位置)。每个部件确认8个测量厚度的位置。
在概率纸上发现原数据有非常态现象。通过简单的对数转换可改进数 据的常态。在此情况下部分低于规定厚度的点用原数据不能通过正态标准表方法 来估计,而要用转换数据。结果所有抽样的点都超过或等于1.000,但与要求值非常接近。
变化组成 分析表明,主要来源是同一部件内的变化。因此提出的修改措施是移动槽内的部 件。这一修改措施分两步实行,第一步是马上进行,第二步则拖后进行,因为需 要特殊工具。
5.3 工艺参数设定
为了方便电流 的设定,用以下参数设置%进行全因子23实验:槽 活动性(80,100);电流,旋钮位置(60,80);温度℃(15,20)。
在此阶段,要部分实施前面分析确认的修改措施 (只实施第一步)。从正态图中可看到,几个交互作用的效应在响应线上具有统 计显著性,而且交互作用在部件变化效应上也是显著的。
有了这 些实验中获得的数据就可以计算各因素和交互作用的效应,建立工艺的数学模型 。显然CI要求的答案偏差使这一模型作用不大,但它足以用来确 认交互作用。这些交互作用可用于确保过程的稳定。根据这一交互作用图,电流 确定在70左右。
工艺进行确定在70必须通过一个验证过程来测试。
5.4 验证过程
对这两批各4个的部件进行验证过程。 在进行试验时要使用用于减少部件变化的工具。
减少部件内部变 化的结果令人满意,抽样部件的最小值点超过要求值5%。要指 出的是,σ的估计是“短期”的,因为只包括部件内的变化。
工序优化可通过生产运行分析生产部件数据 (EVOP方法)来继续进行。
1. 结论
本文提出的结论是:
l 可靠性要求应包括在通用质量要求中。
l 可靠性改进可通过统计质量工程工具来实现。
可靠性改进与质量-一个综合方法
欢迎转载,转载附上中国可靠性网文章原文链接即可!
来源:中国可靠性网 原文链接:https://bbs.kekaoxing.com/50726.html
来源:中国可靠性网 原文链接:https://bbs.kekaoxing.com/50726.html
请登录之后再进行评论