资源描述
3.,*,GE Appliances Copyright 1999,DOE-,比较两种处理方法,修订版10,1999年2月12日,第3局部:,比较两个水平,目的:,介绍具有两个水平的单因素“X”的试验设计方法,目标:,1.理解试验的目标 评估一项变量X的不同水平对因变量Y的影响,2.理解为何要收集试验数据以帮助掌握变差,3.能解释两水平试验的结果,4.供给两水平试验实例 有些我们可以在课堂上做,第3局部:比较两种处理方法,经过设计的试验用于:,确定哪些自变量(X)对因变量(Y)的影响最大,量化自变量(X)对因变量(Y)的影响,证明你认为重要的自变量会对工序真正产生影响,试验结果可以用于:,1.转变工序的均值。例如,加工温度越高越可能增加硬度,并使其等于标准的中间值。,2.削减变差。例如:对接线员进展两星期的培训可能比进展一个星期的培训效果更好,因此,可能会削减不同应答中心应答时间的差异。,3.转变工序的均值,同时削减变差。例如,清洗剂高浓度设置,可能使整个清洗系统的各部位更清洁,其清洁度前后会更全都。,设计试验 为什么要用它们,当重复检测时,通常会得出不同的答案.这就是变差!,1.系统误差 (信号),检测结果可以预期和猜测的的差异。,例子:,灶具的销售量在夏天和圣诞节期间是不一样的,2.随机误差 (噪音),检测值不行以猜测的的差异。,例子:,在不同的两天测试两台一样设计的电冰箱的用电量,由同一技师、在同一地点、同样的温度条件下、使用同样的测量工具等进展测量,可能会得出两种不同的结果。,观测值变化,我们预料观看值会变化。假设没有变化,我们反而担忧。,假设灶具销售量在全部地区都 一样,那么,我们就会疑心数据库消失故障。,假设测试10台电冰箱,用电量都一样,那么,我们就会对测量结果的质量表示疑心。,这种变差使我们的工作具有挑战性!,我们一般不信任从一个数据得来的结果,因而,常常收集多个数据,并特别留意如何收集这些样原来观看变化。,变化是自然的、预期的,是统计学的根底。,观测值变化,(,续),统计学处理变差有以下几种方法:,描述性统计用图和几个总结性数字(均值、方差和标准变差)描述一组数据,统计推断确定结果的差异何时可归因于随机变差、何时不能。,(置信区间和假设检验),试验设计(DOE)收集和分析数据,目的是:,1.转变结果分布的平均值,2.削减结果的变差。,3.产生可以应用于多种条件之下供给更牢靠工序的结果,4.确定潜在关键少数“X”是否对“Y”响应值产生影响,统计的作用,试验设计是指主动掌握自变量,并观看自变量对因变量(响应值)的影响。,被动观看与试验设计,被动观看就是静观工序,而不施加任何带有目的的转变(即:在基准数据收集期间没有转变该工序),被动观看,例:香槟酒最初的产生很自然。可能很多人观看过它,而没有留意到它有什么特殊之处。但是,最终眼光独到的观看者留意到了香槟酒的奇妙前景。,(,Adapted from a lecture by George Box during the course:”An Explanation of Taguchis Contributions to Quality Improvement,”,University of Wisconsin,April 27-30,1987.),细心设计的试验有助于人们对事物的生疏。,例:詹姆斯瓦特开头工业革命始于他对茶壶冒出的蒸汽力气的观看,而这导致了蒸汽机的制造。,被动观看就静观事情的变化,而不是促使事情发生。,细心设计的试验,通过试验设计,人们可以证明通过转变自变量(“X”)而支配或掌握因变量(“Y”)的力量。,我们可通过以下方法改进这种学习过程:,1.确保自然发生的具有学问性的大事引起敏锐观看者的留意,2.通过细心设计的试验,引发具有学问性大事的发生。,技术变革的步伐之快前所未有。,这主要归功于用科学的方法学习的可能性的提高,假设您做些转变,可能会发生令人兴奋的事情.,细心设计的试验是一种通过关键大事和有学问的观看者相结合的学习方法,试验的目标是评估自变量对因变量的影响。,假设我们可以直接掌握工序变量(X1,X2,.,Xk).,这些可能是工序中的温度和压力、我们发货所用的运输公司和拖车装货的班次。,我们想找到能改进响应值(Y1,Y2,.,Ym)的设置。,工序变量;,自变量;,设计变量 X,1,X,2,.,X,k,因变量;,响应值Y,1,Y,2,.,Y,m,X,1,X,2,X,3,Y,X,细心设计的试验(续),为什么做试验?,成功的学习需要什么,1.我们想证明转变和掌握工序的力量。,2.它是到达改进目标的一种系统方法。,1.让令人兴奋的事情发生。,2.需要有人去留意,得出结论的途径可能不止一个;常常是经过多个试验才能得出结论。,数据 -,演绎 归纳 演绎,归纳,想法 -,1,3,2,科学常常是一个反复的过程;或许一系列的试验才能得出答案。,您也可以承受殊途同归的方法。,解决方案,调查的适应性,即使“X”和“Y”相关,也不肯定能用此“X”掌握“Y”!,(相关 因果关系),消灭鹳并不是掌握诞生率的好方法!,我们可以通过观看某个过程来确定关系:,两个变量可能趋向于一同增减,然而,这并不意味着我们可以通过掌握一个变量而调整另一个变量。,留意下面的人口与鹳的数量的图表。,(准确的数据来自Oldenberg,Germany,1930-1936 published in Box,Hunter,Hunter,Statistics for Experimenters,page 8.),30,40,50,60,70,80,120,150,180,210,240,270,人口,(000s),鹳的数量,r=0.901,留意!相关并不意指因果,目标:评估洗涤时间对去污力量的影响。,因变量(Y)是“反响”的变化,是衣物清洁度的测量值。,自变量(X)是洗涤时间。,一个“处理”是X变量的一个水平。本例中的“处理”是20分钟和10分钟洗涤时间。,16次洗涤反响变化记录如下:,20-分钟洗涤:17.4,17.7,23.2,20.4,15.0,24.0,15.6,15.2,10-分钟洗涤:20.4,19.3,17.6,16.3,9.7,16.4,14.8,12.3,反响变化,20-分钟洗涤,10-分钟洗涤,平均,15.85,3.54,标准差,18.56,3.57,x 24,x 23,22,21,x 20 x,19 x,x 18 x,x 17,x 16 xx,xx 15 x,14,13,12 x,11,10 x,实例:滚筒式洗衣机,它们是否具有统计差异?,什么能帮助我们分析这个问题,可以看出两种洗涤时间的标准变差相等,两个均值之间存在统计差异吗?,假设两种洗涤时间产生的衣物清洁度相等。,从其次局部,我们记住:,Ho:m1=m2,Ha:m1=m2,我们能进展双样本T检验证明这一点,但这无助于量化两种洗涤时间的差异,假设有差异的话。,然而,置信区间可以给我们供给这两种答案。,让我们回忆一下置信区间.,假设置信区间包括“0”,我们就不能得出“两个平均值存在,统计差异”这个结论:,平均差异的95%置信区间:,其中:,t,(n,1,+n,2,-2,.025),是,t,表,中自由度为,n,1,+n,2,-2,及单边尾部面积为.025(95%位于其中)相对应的t值。,n,1,和,n,2,是两个样本的样本容量,。,S,p,是总标准差,两个独立方差加权平均值的平方根,。,留意:假设n1和n2增大,区间将减小。,假设检验,Ho:一样(0位于区间内),Ha:差异(0不位于区间内),承受:,置信区间,从我们的试验中:,20分钟洗涤:,平均值=18.56,标准差=3.57,10,分钟洗涤:,平均值=15.85,标准差=3.54,s,p,=3.56,以滚筒式洗衣机为例,:,其中:,C.I.=2.71 +/-3.82 =,(-1.1,6.5),C.I.=(18.56-15.85)+/-2.145 *3.56 *,(1/8+1/8),20分钟洗涤,可能,比10分钟洗涤的,清洁度提高,6.5个单位,,,或者,可能降低,1.1个单位,。,置信区间的解释,1.(X1 -X2)是对总体平均值之间真实差值的点估量,或最可能估量,2.但全部观测值都可能有误差,所以总体平均值的真正差值可能比这个值稍高或稍低。置信区间供给总体平均值间真正差值的一个可能的取值范围。,3.95%的时间,总体的平均值间的真正差值位于置信区间所描述的范围内。,置信区间给出了,可能的取值范围,假设在30天内,每天都取20分钟洗涤时间的清洁度为样本其间洗涤过程稳定。假设其分布为正态,平均值为19,标准差为3。,我们可以:,每天测量一个样本,或,每天测量4个样本,并记录平均值。,样本容量对平均值分布的影响,以下是每天检测一个样本或四个样本的模拟结果。,每天,每天,1个,每天4个样本的平均值,平均值(30个样本,)(共,120个样本),平均值:,18.618.4,标准差:2.841.45,24,X,23XX,22XX,21XXXXX,20XXXXXXXX,19XXXXXXXXXXX,18XXXXXXXXXXXXX,17XXXXXXX,16XXXXXXX,15XX,14,13XX,平均值的变化小于单个值的变化。较小的变化量给我们供给了更强的觉察差异的力量。,样本容量对平均值分布的影响(续),每天,每天,1个,每天4个样本的平均值,平均值(30个样本,)(共,120个样本,),平均值,:18.618.4,标准差:2.841.45,24,X,23XX,22XX,21XXXXX,20XXXXXXXX,19XXXXXXXXXXX,18XXXXXXXXXXXXX,17XXXXXXX,16XXXXXXX,15XX,14,13XX,每天四个样本平均值的标准差计算公式为:,平均值的标准误差:,标准差(变差)在用每天四个样本测量值时变小。实际变小系数为,4=2。,运用Minitab比较两种处理,例:以滚筒式洗衣机为例,洗涤时间对消退污渍的力量有多大作用?,(也就是说,假设衣物洗涤时间长,看起来就“更洁净”吗?),我们使用清洁度作为去污的测量标准。,在进展统计分析之前,应运用简洁图表,如散点图和点阵图查看数据,注:每组只有8个点,因此直方图无法供给充分的信息。,运用Minitab以图形方式比较两种处理,File Open,L:minitabtrainingminitabSession 3reflect.mtw,C3和C4栏中的数据将用于产生全部图表和数字结果。,20分钟洗涤的清洁度,C1 C2 C3 C4,TwentyTenReflectTime,17.420.417.420,17.719.317.720,23.217.623.220,20.416.320.420,15.0 9.715.020,24.016.424.020,15.614.815.620,15.212.315.220,20.410,19.310,17.610,16.310,9.710,16.410,14.810,12.310,存储的数据,10分钟洗涤的清洁度,参考数据,GraphPlot and/or Boxplot,将变量制图:Y=,清洁度,X=时间,运用Minitab以图形方式比较两种处理(续),10分钟洗涤与20分钟洗涤的清洁度之间很可能存在差异。这种差异是偶然发生的,还是20分钟洗涤使衣服明显洁净?,记住,我们可以将两个平均值相减而得到其差值的“点估量”,但我们也想弄了解“点估量”预期的变差有多大“置信区间”。,以图形方式比较两种处理(续),运用T检验方法,我们能获得两组数据平均值间差值的点估量及其置信区间。,假设两种处理方法的平均值存在统计差异,置信区间将不包含0。,运用双样本t检验,产生统计值和置信区间:,StatBasic Stat2-sample t,填写以下对话框。然后单击 OK。,留意:由于前面计算的标准差一样(3.57,3.54),因此我们可以选中这个对话框,承受Minitab 以数学方式比较
展开阅读全文