资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第八章 假设检验,假设检验是统计推断的一个主要部分,.,在科学研究,日常工作甚至生活中经常对某一件事情提出疑问,.,解决疑问的过程往往是先做一个和疑问相关的假设,然后在这个假设下去寻找有关的证据,.,如果得到的证据是和假设相矛盾的,就要否定这个假设,.,1,8.1,假设检验的概念,当总体分布函数完全未知或只知其形式、但不知其参数的情况,为推断总体的性质,提出某些关于总体的假设。,为判断所作的假设是否正确,从总体中抽取样本,根据样本的取值,按一定的原则进行检验,然后,作出接受或拒绝所作假设的决定,.,何为,假设检验,?,2,其理论背景为,实际推断原理,即,“,小概率原理,”,其想法和前面的最大似然类似:,如果实际观测到的数据在某假设下不太可能出现,则认为该假设错误。,我们主要讨论的假设检验的内容有,参数检验,非参数检验,:,总体均值、均值差的检验,总体方差、方差比的检验,分布拟合检验,假设检验的理论依据,3,例,1:,某产品的出厂检验规定,:,次品率,p,不超过,4%,才能出厂,.,现从一万件产品中任意抽查,12,件,发现,3,件次品,问该批产品能否出厂?若抽查结果发现,1,件次品,问能否出厂?,解,:,先作一个假设。,在,H,0,成立时,我们称,H,0,是原假设或零假设,.,再作一个备择假设,4,这不是,小概率事件,没理由拒绝原假设,。在不准备继续抽样的情况下,作出接受原假设的决定,即该批产品可以出厂,.,这是,小概率事件,一般在一次试验中是不会发生的,现一次试验竟然发生,故可认为原假设不成立,即该批产品次品率,p,0.04,则该批产品不能出厂,.,若抽查结果发现,1,件次品,则,在,H,0,成立时,5,例,2:,一条新建的南北交通干线全长,10,公里,.,公路,穿过一个隧道,(,长度忽略不计,),隧道南面,3.5,公里,北面,6.5,公里,.,在刚刚通车的一个月中,隧道南,发生了,3,起交通事故,而隧道北没有发生交通事,故,能否认为隧道南的路面更容易发生交通事故,?,分析,:,用,p,表示一起交通事故发生在隧道南的概,率,.,则,p,=0.35,表示隧道南北的路面发生交通事故,的可能性相同,.,p,0.35,表示隧道南的路面发生交,通事故的概率比隧道北的路面发生交通事故的,概率大,.,-,为了作出正确的判断,先作一个假设,6,H,0,:,p,=0.35.,我们称,H,0,是原假设或零假设,.,再作一个备择假设,H,1,:,p, 0.35,.,在本问题中,如果判定,H,0,不对,就应当承认,H,1,.,检验,:,三起交通事故的发生是相互独立的,他们之间没有联系,.,如果,H,0,为真,则每一起事故发生在隧道南的概率都是,0.35,于是这三起交通事故都发生在隧道南的概率是,P,= 0.35,3, 0.043.,这是一个很小的概率,一般不容易发生,.,7,所以我们否定,H,0,认为隧道南的路面发生交通事故的概率比隧道北大,.,做出以上结论也有可能犯错误。,这是因为当隧道南北的路面发生交通事故的概率相同,而,3,起交通事故又都出现在隧道南时,我们才犯错误。,这一概率正是,P,=0.043.,于是,我们,判断正确的概率是,1-0.043=95.7%,8,假设检验中的基本概念和检验思想,根据问题的背景,提出原假设,H,0,:,p,=0.35,及其备择假设,H,1,:,p,0.35.,(2),在,H,0,成立的假设下,计算观测数据出现的概率,P.,如果,P,很小,(,一般用,0.05,衡量,),就应当否定,H,0,承认,H,1,;,9,注:,为了简便,我们把以上的原假设和备择假设记作,H,0,:,p,=0.35 vs,H,1,:,p,0.35.,其中的,vs,是,versus,的缩写,.,如果,P,不是很小,也不必急于承认,H,0,这是因为证据往往还不够充分,.,如果继续得到的观测数据还不能使得,P,降低下来,再承认,H,0,不迟,.,10,参数检验的一般提法,一般来讲,设,X,1,X,2,X,n,是来自总体,X,的样本,是总体,X,的未知参数,但是已知,0,1,它们,是互不相交的参数集合,.,对于假设,H,0,:,0,vs,H,1,:,1,根据样本,构造一个,检验统计量,T,和,检验法则:,若与,T,的取值有关的一个,小概率事件,W,发生,则否定,H,0,,否则接受,H,0,,而且要求,此时称,W,为,拒绝域,,,为,检验水平,。,11,例,3.,某厂生产的螺钉,按标准强度为,68,克,/mm,2,而实际生产的螺钉强度,X,服从,N,(,3.6,2,).,若,E,(,X,) =,= 68,则认为这批螺钉符合要求,否则认为不符合要求.为此提出如下,原假设,H,0,:,= 68,和,备择假设,问原假设是否正确,?,H,1,:, ,68,现从该厂生产的螺钉中抽取容量为,36,的样本,其样本均值为,12,解:,构造,检验统计量,又因为 是,的无偏估计。则它偏离,68,不应该太远,偏离较远是小概率事件。,故,取较大值也是小概率事件。,若原假设,H,0,正确,则,由于,13,如,= 0.05,。,确定一个常数,c,使得,则,规定,为小概率事件的概率大小,也是显著水平。,通常取,= 0.05, 0.01,14,由,于是检验的,拒绝域,为,现根据样本观测值,,现,未落入,拒绝域,则接受原假设,H,0,:,= 68,15,解决假设检验的问题时,无论作出否定还是接受原假设,H,0,的决定,都有可能犯错误,.,我们称否定,H,0,时犯的错误为第一类错误,接受,H,0,时犯的错误为第二类错误,.,具体如下,(1),H,0,为真,统计推断的结果,否定,H,0,犯,第一类,错误,犯该错误的概率不超过,。,(2),H,0,为假,统计推断的结果,接受,H,0,犯,第二类,错误,,我们记犯该错误的概率为,。,假设检验的两类错误,16,H,0,为真,H,0,为假,真实情况,所作判断,接受,H,0,拒绝,H,0,正确,正确,第一类错误,(,弃真,),第二类错误,(,取伪,),犯第一类错误的概率通常记为,犯第二类错误的概率通常记为,假设检验的两类错误,17,如在,例,1,中,如果第一起交通事故发生后,就断定隧道南更容易发生交通事故,犯第一类错误的概率是,0.35,.,当第二起交通事故发生后,断定隧道南更容易发生交通事故,犯第一类错误的概率是,0.35,2,=0.1225.,如果第四起交通事故又发生在隧道南,否定,p,=0.35,时犯第一类错误的概率是,0.35,4,=0.015,.,18,P,(,拒绝,H,0,|,H,0,为真,),在,例,3,中,19,在假设检验中,我们希望所用的检验方法尽量少犯错误,但不能完全排除犯错误的可能性,.,理想的检验方法应使犯两类错误的概率都很小,但在样本的容量给定的情形下,不可能使两者都很小,降低一个,往往使另一个增大,.,20,假设检验的指导思想,是,控制犯第一类错误的概率不超过,然后,若有必要,通过增大样,本容量的方法来减少,.,因为,假设检验一般控制第一类错误在检验水平,以下, 所以,否定,H,0,时结论比较可靠,。,如果,承认,H,0,,,可能犯第二类错误,,错误概率可能会比较大,。,21,在正确的统计推断前提下, 犯错误的原因总是随机因素造成的,。,要有效减少犯错误的概率, 只好增加观测数据,或在可能的情况下提高数据的质量,,这相当于降低数据的样本方差,.,22,例,4,:,第一类错误与第二类错误的比较,一个有,20多年教龄的教师声称他上课从来不“点名”. 如何判定他讲的话是真实的?,确立原假设,H,0,: 他没有点过名,。,然后再调查,H,0,是否为真,.,当调查了他教过的,3个班, 都说他没有点过名, 这时如果承认,H,0, 犯错误的概率还是较大的.,当调查了他教过的,10个班, 都说他没有点过名, 这时承认,H,0,犯错误的概率会明显减少,。,如果调查了他教过的,30个班, 都说他没有点过名, 这时承认,H,0,犯错误的概率就会很小了,。,可惜调查,30个班是很难做到的,!,23,反过来, 在调查中只要有人证实这位老师点过名, 就可以否定,H,0,了,(不论调查了几个班), 并且这样做犯错误的概率很小.,例,4告诉我们,要否定原假设,H,0,是比较简单的, 只要观测到了,H,0,下小概率事件就可以。,要承认,H,0,就比较费力了,: 必须有足够多的证据(样本量), 才能够以较大的概率保证,H,0,的真实,.,在这个例子中还有一个现象值得注意,: 当调查10个班发现都没有点过名就承认,H,0,时, 即使判断失误, 造成的后果也不严重. 因为数据已经说明这位老师不爱点名.,24,假设检验步骤,(,三部曲,),根据实际问题所关心的内容,建立,H,0,与,H,1,。,在,H,0,为真时,选择合适的统计量,T,并,确定,拒绝域,。,根据样本值计算,并作出相应的判断,.,25,8.2,正态均值的假设检验,A.,已知,时,,的,正态,检验,法,例,5:,一台方差是,0.8,克的自动包装机在流水线上包装净重,500,克的袋装白糖,.,现随机抽取了,9,袋白糖,测得净重如下,(,单位,:,克,),:,499.12 499.48 499.25 499.53,500.82 499.11 498.52 500.01 498.87.,能否认为包装机在正常工作,?,分析,:,9,袋白糖中有,7,袋净重少于,500,克,似乎净重,0,=500,不对,.,但是,方差是,0.8,克,也可能是由于包装机的随机误差导致了以上的数据,.,26,解:,将包装机包装的袋装白糖的净重视为总体,X,则,X N,(,2,),,,其中,2,=0.8,已知,,未知,.,在,H,0,下,用,X,j,表示第,j,袋白糖的净重,则,X,1,X,2,X,9,是来自总体,X,的,n,=9,个样本,.,提出假设,H,0,:,=,0,vs,H,1,:,0,.,若要求,27,对于标准正态分布,,c,应为其上,/2,分位数,z,/2,,于是,拒绝域,为,本例中,如果取,=0.05,则,根据抽样数据,得,|,z,| = 1.97,时,不该发生的小概率事件发生了,于是否定原假设,H,0,.,28,在例,5,中,,称,为检验的显著性水平,简称为,显著性水平,检验水平,或水平,(level);,Z,称为,检验统计量,;,|,Z,|,z,/2,称为检验的,拒绝域,或否定域,;,-,由于这种检验方法是基于正态分布的方法,所以又称为,正态检验法或,Z,检验法,.,-,拒绝域是一个事件,它的发生与否由,|Z|,从而由观测样本,X,1,X,2,.,X,n,决定,.,-,如果事件,|,Z,|,z,/2,发生了,就称,检验是显著的,.,这时否定,H,0,犯第一类错误的概率不超过,。,29,在例,5,中,如果取检验水平,=0.04,则临界值,z,/2,=2.054 .,这时,|,z,|=1.97 68,例,3,中的备择假设是双侧的,.,某厂,生产的螺钉强度,X,服从,N,(,3.6,2,).,如果根据以往的生产情况,按标准强度,0,=68.,现采用了新工艺,关心的是新工艺能否提高螺钉强度,越大越好,.,此时,可作如下的假设检验,:,31,当,原假设,H,0,:,=,0,= 68,为真时,取较大值的概率较小,当,备择假设,H,1,:, 68,为真时,取较大值的概率较大,给定显著性水平,根据,可确定,拒绝域,称这种检验为,单边检验,.,32,原假设,H,0,:, 68,备择假设,H,1,:, 68,另外,可设,若原假设,H,0,正确,要求,33,但现不知,的真值,只知,0,= 68,。,由于,且,所以,只要取,C,=,z,,可得,34,于是,为,小概率事件。,故取拒绝域为,此时,犯第一类错误的概率,。,35, ,0,0,0,0,0,Z,检验法,(,2,已知,),原假设,H,0,备择假设,H,1,检验统计量及其,H,0,为真时的分布,拒绝域,36,在例,5,中,从实际数据计算得到,|,z,|=1.97.,如果拒绝域取成, |,Z,|,1.97,则刚刚能够拒,绝,H,0,.,这时犯第一类错误的概率是,P,=,P,(|,Z,|1.97)=0.0488.,我们称,P,=0.0488,是检验的,P,值,(P-value).,B.,P,值检验法,检验的,P值,(P-value),是指在,H,0,成立的假设下,根据已知观测,,H,0,被拒绝时最小的显著性水平。,37,P,值越小,数据提供的否定,H,0,的证据越充分,.,如果检验的显著性水平,是事先给定的,当,P,值小于等于,就要否定,H,0,.,引入,P值,,可以使假设检验的结果更有意义。,P,值是在,H,0,成立的假设下观测到的样本倾向于,H,1,的概率。,在例,5,中,检验法的P值是P=P(|Z| |z|) =2,(-|z|).,38,C.,未知,时,均值,的,t,检验,法,例,6:,在例,5,中如果,9,个袋装白糖的样品是从超级市场仓库中随机抽样得到的,能否认为这批,500,克袋装白糖的平均重量是,500,克,?,标准差,未知,可用样本标准差,S,代替,.,解,:,对,0,=500,克,仍作假设,H,0,:,=,0,vs,H,1,:,0,.,39,在,H,0,下,从,7.3,节的定理,3.6,知道,检验统计量,说明在,H,0,下,T,在,0,附近取值是正常的,如果,|,T,|,取值较大就应当拒绝,H,0,.,根据分位数,t,/2,(,n,-1),的性质,有,P,(|,T,|,t,/2,(,n,-1)=,.,于是,H,0,的显著性水平为,的,拒绝域,是,|,T,|,t,/2,(,n,-1),40,取,=0.05,查表得到,t,0.05/2,(8)=2.306.,经过计算得到,S,=0.676, |,T,|= 2.609 2.306,所以应当否定,H,0,认为,500.,作出以上判断也有可能犯错误,但是犯错误的概率不超过,0.05.,由于这种检验方法是基于,t,分布的方法, 所以又称为,t,检验法,.,41,设统计量的计算结果为,a,则检验法的,值,为,其中,,42,D.,未知,时,均值,的,单边,检验,法,例,7,:,在例,6,中, 抽查的9袋白糖的平均重量,为,499.412,克,可以引起我们的怀疑.,这批袋装白糖的平均重量是否不足呢?,解:,为了解决这个问题,我们提出假设,H,0,:,500,vs,H,1,:,500,如果否定了,H,0,就认定这批袋装白糖的份量不足,.,由于,在,H,0,下,不知道,的具体值,所以,T,的分布是未知的,.,43,但是这时有,H,0,:,500,vs,H,1,:,500,因为,P,(,T,-,t,(,n,-1),P,(,T,0,-,t,(,n,-1)=,所以可以构造,拒绝域,为,T,-,t,(,n,-1),当,T,-,t,(,n,-1),应当否定,H,0,44,在本例中,查表得到,-,t,0.05,(8)=-1.86,T,=-2.609-1.86,所以应当否定,H,0,.,认定这批袋装白糖的分量不足。这时, 犯错误的概率不超过,0.05.,由于这种检验方法是基于,t,分布的方法,所以又称为,t,检验法,.,本例中, 以,为检验的拒绝域时, 刚刚可以拒绝,H,0,。所以检验的,值,是,P,=,P,(,)= 0.0156, 500,拒绝域为: ,经过计算可知,T=,2.609,,故,不拒绝,H,0,,,即检验是,不显著,的。,47,分析例,5和7的问题背景就会看出,在例5中应当作双边检验,因为多装和少装白糖都是不符合生产标准的,.,在例,7中只需要作单边检验,因为超市只需要知道袋装白糖不缺斤少两就够了,.,48,例,8.,糕点厂经理为判断牛奶供应商所供应的鲜牛奶是否被兑水,对它供应的牛奶进行了随机抽样检查,. 测得12个鲜牛奶样品的冰点如下,-0.5426,-0.5467,-0.5360,-0.5281,-0.5444,-0.5468,-0.5420,-0.5347,-0.5468,-0.5496,-0.5410,-0.5405,.,已知天然牛奶的冰点是,-0.545,摄氏度,.,问牛奶是否被兑水,.,分析:,设,n,=12用,表示第,i,个样品的冰点, 则,是来自正态总体 的样本,参,数 未知。,如果牛奶没有被兑水,那么,49,根据测量的数据可以计算出样本均值 ,0.5416, 样本方差,S = 0.0061.,由于水的冰点是,摄氏度, 所以兑水牛奶的冰点将会提高,。现在,0.545,于是有理由怀疑牛奶被兑水.,50,解:,根据测量的数据可以计算出样本均值 ,0.5416, 样本方差,S = 0.0061,。设,=,0.545,,作假设,检验统计量,查,t,分布表得,t,0,.,05,(1,1,) = 1.7,96,。,所以可以构造,拒绝域,为,T,t,(,n,-1),51,经计算,T,1.9308, 1.796,检验是显著的, 所以否定,,认为牛奶被兑水。,判断牛奶被兑水, 犯错误的概率不超过检验水平,。,本例中检验的,值,是,由于这种检验方法是基于,t,分布的方法,所以又称为,t,检验法,.,52,设统计量的计算结果为,则检验法的,值,为,其中,,53, ,0,0,0,0,0,T,检验法,(,2,未知,),原假设,H,0,备择假设,H,1,检验统计量及其,H,0,为真时的分布,拒绝域,54,例,9:,某厂生产小型马达,其说明书上写着,:,这种小型马达在正常负载下平均消耗电流不会超过,0.8,安培,.,现随机抽取,16,台马达试验,求得平均消耗电流为,0.92,安培,消耗电流的标准差为,0.32,安培,.,假设马达所消耗的电流服从正态分布,取显著性水平为,= 0.05,问根据这个样本,能否否定厂方的断言,?,55,分析,:由于,可知样本支持,考虑将,作备择假设,以便拒绝零假设,解一:,根据题意待检假设可设为,H,0,:,0.8 vs,H,1,:, 0.8,未知,故,选,检验统计量,:,56,拒绝域,为,故接受原假设,即,不能否定,厂方断言,.,H,0,:,0.8 vs,H,1,:, 0.8,查表得,t,0,.,05,(15) = 1.753,计算得,57,讨论,1,:,如果从,p,值来看, 即使拒绝零假设,,否认厂方断言,犯错误的概率也不超过,0.0772,。,讨论,2,:,由于根据现有样本, ,但检验却没有拒绝 ,这是主要因为样本容量,n,16,还不够大,在水平,0.05,下现有证据还不足以得出显著性的结论。还需继续抽样。,58,解二,H,0,:,0.8,;,H,1,:, 0.8,检验统计量,:,拒绝域,为,T,-,t,(,n,-1),.,查表得,t,0,.,05,(15) = 1.753,计算得,故接受原假设,即,否定,厂方断言,.,59,检验就更不显著了,不值得提倡。,讨论,3,:,从,p,值来看, 意味着拒绝零假设犯错误的概率极高,即:,承认厂方断言,犯错误的概率极高。,60,由例,7,可见,:,对问题的提法不同,(,把哪个假设作为原假设,),统计检验的结果也会不同,.,由于假设检验是控制犯第一类错误的概率,使得拒绝原假设,H,0,的决策变得比较慎重,也就是,H,0,得到特别的保护.,因而,通常把有把握的,经验的结论作为原假设,或者尽量使后果严重的错误成为第一类错误,.,上述两种解法的立场不同,因此得到不同,的结论,.,第一种假设,是,不轻易否定厂方,的结论;,第二种假设,是,不轻易相信厂方,的结论,.,61,例,10:,设概率统计考试考生的成绩,XN,(,2,),从中随机地抽取,36,位考生的成绩,算得平均成绩为,66.5,分,标准差为,15,分,.,问在显著性水平,0.05,下,是否可以认为这次考试的平均成绩为,70,分?并给出检验过程,.,解,:,根据题意待检假设可设为,拒绝域,为,检验统计量,62,故接受,H,0,即认为这次考试的平均成绩为,70,分,.,经计算,注意:,如果,接受,平均成绩为,70,分,那么犯第二类错误的概率可能很大。,63,作业,: 8.3; 8.6;8.21,64,
展开阅读全文