资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,SSMC,中国人民大学六西格玛质量管理研究中心,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,SSMC,中国人民大学六西格玛质量管理研究中心,中国人民大学六西格玛质量管理研究中心,六西格玛管理培训丛书(,5,),何晓群 主编,六西格玛数据分析技术,何晓群 编著,光盘作者:陶 沙 苏晨辉,中 国 人 民 大 学 出 版 社,中国人民大学六西格玛质量管理研究中心,第,5,章 假设检验,5.1,广告宣传的虚假性,5.2,假设检验,(hypothesis testing),的几个步骤,5.3,单侧检验,(one-tailed hypothesis),5.4,双侧检验,(two-tailed hypothesis),5.5,两类错误,5.6,检验的应用,小组讨论与练习,返回目录,中国人民大学六西格玛质量管理研究中心,本 章 目 标,1.,了解假设检验的原理,2.,掌握假设检验的步骤,3.,了解怎样辨别,I,类和,II,类错误,4.,学会计算单尾和双尾概率,返回目录,中国人民大学六西格玛质量管理研究中心,5.1,广告宣传的虚假性,手机电池的使用寿命不是按年来计算的,而是按电池的充放电次数来计算的。镍氢电池一般可充放电,200-300,次,锂电池一般可充放电,350-700,次。某手机电池厂商宣称其一种改良产品能够充放电,900,次,为了验证厂商的说法,消费者协会对,10,件该产品进行了充放电试验。得到的次数分别为,891,,,863,,,903,,,912,,,861,,,885,,,874,,,923,,,841,,,836,。,返回目录,中国人民大学六西格玛质量管理研究中心,广告宣传是虚假的吗,上述数据的均值为,878.9,,明显少于,900,。,但是,到底均值落在什么范围内我们就认为广告宣传是虚假的呢?,900,接受广告宣传,现在的问题是如何确定这两条线的位置,返回目录,中国人民大学六西格玛质量管理研究中心,假设检验的原理,假设检验的原理是,逻辑上的反证法,和,统计上的小概率原理,反证法:当一件事情的发生只有两种可能,A,和,B,,如果能否定,B,,则等同于间接的肯定了,A,。,小概率原理:发生概率很小的随机事件在一次实验中是几乎不可能发生的。,返回目录,中国人民大学六西格玛质量管理研究中心,假设检验的原理,(,续,),由于个体差异的存在,即使从同一总体中严格的随机抽样,,X,1,、,X,2,、,X,3,、,X,4,、,也不尽不同。,它们的 不同有两种(只有两种)可能:,(,1,)分别所代表的总体均值相同,由于抽样误差造成了样本均值的差别。差别无显著性。,(,2,)分别所代表的总体均值不同。差别有显著性。,返回目录,中国人民大学六西格玛质量管理研究中心,5.2,假设检验的几个步骤,假设检验的一般步骤,即提出假设、确定检验统计量、计算检验统计量值、做出决策。,提出假设,构造统计量,做出统计,决策,计算统计量值,做出推断,返回目录,中国人民大学六西格玛质量管理研究中心,提出假设,在决策分析过程中,人们常常需要证实自己通过样本数据对总体分布形式做出的某种推断的正确性(比如,总体的参数,大于某个值,0,),这时就需要提出假设,假设包括零假设,H,0,与备择假设,H,1,。,返回目录,中国人民大学六西格玛质量管理研究中心,零假设的选取,假设检验所使用的逻辑上的间接证明法 决定了我们选取的零假设应当是与我们希望证实的推断相对立的一种逻辑判断,也就是我们希望否定的那种推断。,返回目录,中国人民大学六西格玛质量管理研究中心,零假设的选取,(,续一,),同时,作为零假设的这个推断是不会轻易被推翻的,只有当样本数据提供的不利于零假设的证据足够充分,使得我们做出拒绝零假设的决策时错误的可能性非常小的时候,才能推翻零假设。,返回目录,中国人民大学六西格玛质量管理研究中心,零假设的选取,(,续二,),所以,一旦零假设被拒绝,它的对立面,我们希望证实的推断就应被视为是可以接受的。,返回目录,中国人民大学六西格玛质量管理研究中心,构造检验统计量,收集样本信息,利用样本信息构造检验统计量,返回目录,中国人民大学六西格玛质量管理研究中心,计算检验统计量值,把样本信息代入到检验统计量中,得到检验统计量的值。,返回目录,中国人民大学六西格玛质量管理研究中心,做出决策,1,、规定显著性水平,,也就是决策中所面临的风险,2,、决定拒绝域,(critical region),和判别值,(critical value),3,、判定检验统计量是否落在拒绝域内,4,、得出关于,H,0,和关于,H,1,的结论,返回目录,中国人民大学六西格玛质量管理研究中心,显著性水平,显著性水平,是当原假设正确却被拒绝的概率,通常人们取,0.05,或,0.01,这表明,当做出接受原假设的决定时,其正确的可能性,(,概率,),为,95%,或,99%,返回目录,中国人民大学六西格玛质量管理研究中心,判定法则,1,、如果检验统计量落入拒绝域中,则拒绝原假设,2,、如果检验统计量落入接受域中,则我们说不能拒绝原假设,注意:判定法则,2,的含义是指我们在这个置信水平下,没有足够的证据推翻原假设;实际上,如果我们改变,置信水平或样本数量就有可能得到与先前相反的结果。,返回目录,中国人民大学六西格玛质量管理研究中心,零假设和备择假设,零假设,备择假设,1.,大于等于,(),小于,(,),2.,小于等于,(),大于,(,),3.,等于,(,),不等于,(),可能的零假设和备择假设的情况,返回目录,中国人民大学六西格玛质量管理研究中心,5.3,单侧检验,(one-tailed hypothesis),某种果汁的包装上标明其原汁含量至少为,90%,。假定我们想通过假设检验对这项说明进行检验。,返回目录,中国人民大学六西格玛质量管理研究中心,检验的方向性,如果要检验的问题带有方向性,如灯泡寿命、电池时效、头盔防冲击性等数值是越大越好;零件废品率、生产成本等数值则是越小越好,这类问题的检验就属于单侧检验。,返回目录,中国人民大学六西格玛质量管理研究中心,临界值,接受域,拒绝域,单侧检验,拒绝域和临界值,接受域,拒绝域,临界值,左单侧检验,右单侧检验,返回目录,中国人民大学六西格玛质量管理研究中心,单侧检验的例子,例,5,1:,一家食品公司广告说他的一种谷物一袋有,24,千克。消费者协会想要检验一下这个说法。他们当然不可能打开每袋谷物来检查,所以只能抽取一定数量的样品。取得这个样本的均值并将其与广告标称值作比较就能做出结论。请给出该消费者协会的零假设和备择假设。,返回目录,中国人民大学六西格玛质量管理研究中心,单侧检验的例子,(,续一,),解,:,(一)、,首先找出总体参数,这里应该是总体的均值,m,,,即谷物的平均重量,给出原假设和备择假设,即用公式表达两个相反的意义。,H,0,:m 24(,均值至少为,24),H,a,:m 24(,均值少于,24),(二)、,确定概率分布和用来做检验的检验统计量。,我们要检验抽取的样本均值是否达到广告宣称的数额,就可以用样本均值离标称值的标准离差个数的多少来判断。,因此构造检验统计量,返回目录,中国人民大学六西格玛质量管理研究中心,单侧检验的例子,(,续二,),(三),、,设定置信水平为,95%,。收集样本信息,假设选取了一个数目为,40,的样本,计算得,计算检验统计量的值为(,=0.2,),(四),、,查表可以得出临界值和拒绝域,也可用计算机输出,p,值。计算出的,Z,值落入拒绝域,所以拒绝,H,0,,即意味着我们认为谷物的重量达不到厂商宣称的数值,。,返回目录,中国人民大学六西格玛质量管理研究中心,5.4,双侧检验,(two-tailed hypothesis),中宝普通瓶装啤酒的标称容积是,640,毫升。中宝啤酒公司质检部认识到,如果质量控制失控的话,则该生产线生产的瓶装啤酒液体平均容积将少于或多于,640,毫升。前一种情况下,会使产品信誉受到损害;后一种情形下,不仅会使成本上升,还有可能造成安全隐患。因此质检部定期从生产线上抽取一定数量的啤酒组成样本来检验其质量是否达到要求。,返回目录,中国人民大学六西格玛质量管理研究中心,双侧检验,一些产品某一项指标必须满足在某一个范围内,如精密零件的尺寸和重量、保险丝适用的电流强度等等,这类问题的检验属于双侧检验。,返回目录,中国人民大学六西格玛质量管理研究中心,双侧检验,图例,:,拒绝域和临界值,拒绝域,临界值,接受域,拒绝域,返回目录,中国人民大学六西格玛质量管理研究中心,5.5,两类错误,假设检验是基于样本信息做出的结论,而我们知道样本只是代表了总体的一部份信息,因此必须考虑发生误差的概率。,H,0,为真时我们拒绝,H,0,的错误称为第,I,类错误,犯这种错误的概率用,来表示,简称为,错误或弃真错误;,当,H,0,为伪时我们接受,H,0,的错误称为第,II,类错误,犯这种错误的概率用,来表示,简称为,错误或取伪错误。,返回目录,中国人民大学六西格玛质量管理研究中心,两类错误出现的场合,接受零假设,拒绝零假设,零假设为真,零假设为假,正确,-,无偏差,I,类错误,II,类错误,正确,-,无偏差,返回目录,中国人民大学六西格玛质量管理研究中心,接受,H,0,拒绝,H,0,,接受,H,1,H,0,为真,1,(正确决策),(弃真错误),H,0,为伪,(取伪错误),1,(正确决策),两类错误发生的概率,两类错误发生的概率如下表所示:,返回目录,中国人民大学六西格玛质量管理研究中心,两类错误的关系,接受,H,0,拒绝,H,0,II,类错误,I,类错误,返回目录,中国人民大学六西格玛质量管理研究中心,例,5,2:,一道工序用自动化车床连续加工某种零件,由于刀具损坏等会出现故障,.,故障是完全随机的,并假定生产任一零件时出现故障机会均相同,.,工作人员是通过检查零件来确定工序是否出现故障的,.,现积累有,100,次故障纪录,故障出现时该刀具完成的零件数如下:,459 362 624 542 509 584 433 748 815 505,612 452 434 982 640 742 565 706 593 680,926 653 164 487 734 608 428 1153 593 844,527 552 513 781 474 388 824 538 862 659,775 859 755 49 697 515 628 954 771 609,402 960 885 610 292 837 473 677 358 638,699 634 555 570 84 416 606 1062 484 120,447 654 564 339 280 246 687 539 790 581,621 724 531 512 577 496 468 499 544 645,764 558 378 765 666 763 217 715 310 851,试判断安全加工零件数是否大于,500.,5.6,检验的应用,返回目录,中国人民大学六西格玛质量管理研究中心,假设检验的,Minitab,实现,运行软件,输入数据,点击菜单,Stat-Basic statistics-1-Sample t,返回目录,中国人民大学六西格玛质量管理研究中心,假设检验的,Minitab,实现,(,续一,),弹出对话框如图,输出图像,置信水平及备择假设的选取,返回目录,中国人民大学六西格玛质量管理研究中心,Minitab,输出结果,均值,零假设均值,500,p,值小于,0.05,表明拒绝原假设,即,安全加工零件数显著大于,500,置信水平,返回目录,中国人民大学六西格玛质量管理研究中心,其它注意事项,选择假设检验方法要注意符合其应用条件;,当不能拒绝,H,0,时,即差异无显著性时,应考虑的因素:,可能是样品数目不够;,单侧检验与双侧检验的问题。
展开阅读全文