资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,8.1 假设检验的概念,假设检验是统计推断的一个主要部分。其想法和前面的最大似然类似:,如果实际观测到得到数据在某假设下不太可能出现则认为该假设错误。,第八章 假设检验,1,解:,隧道南3.5公里, 隧道北6.5公里.,用p表示一起交通事故发生在隧道南的概率.,则p=0.35表示隧道南北的路面发生交通事故的可能性相同.,p0.35表示后隧道南的路面发生交通事故的概率比隧道北的路面发生交通事故的概率大.,例 1.1:,一条新建的南北交通干线全长10公里. 公路穿过一个隧道(长度忽略不计),隧道南面3.5公里, 北面6.5公里. 在刚刚通车的一个月中, 隧道南发生了3起交通事故, 而隧道北没有发生交通事故,能否认为隧道南的路面更容易发生交通事故?,2,为了作出正确的判断, 先作一个假设,H,0,: p=0.35.,我们称H,0,是,原假设,或,零假设,.,再作一个,备择假设,H,1,: p 0.35.,在本问题中,如果判定H,0,不对,就应当承认H,1,.,三起交通事故的发生是相互独立的, 他们之间没有联系.,如果H,0,为真, 则每一起事故发生在隧道南的概率都是0.35,3,于是这三起交通事故都发生在隧道南的概率是,这是一个很小的概率, 一般不容易发生.,所以我们否定H,0, 认为隧道南的路面发生交通事故的概率比隧道北大.,做出以上结论也有可能犯错误, 犯错误的概率正是0.043.,这是因为当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯错误. 这一概率正是P=0.043.,于是, 我们判断正确的概率是1-0.043=95.7% (在多次解决类似问题意义下).,4,通过对例1.1的分析, 我们得到以下的概,念,进行假设检验时,根据问题的背景, 提出,原假设,H,0,:,p,=0.35,及其备择假设,H,1,:,p,0.35.,在,H,0,成立的假设下, 计算观测数据出现的概率P.,如果,P很小(一般用0.05衡量), 就应当否定 , 承认 ;,5,为了简便, 我们把以上的原假设和备择假设记作,H,0,:,p,=0.35 vs,H,1,:,p,0.35.,其中的vs是versus的缩写.,如果P不是很小, 也不必急于承认,H,0, 这是因为证据往往还不够充分.,如果继续得到的观测数据还不能使得P降低下来, 再承认,H,0,不迟.,6,一般来讲,设 是来自总体X的样本,是总体的未知参数, 但是已知 。 这里 是 的大写, 是互不相交的参数集合。,对于假设,的检验法,(我们用,表示这个检验法),,参数检验的一般提法,如果否定 时犯错误的概率不超过 , 就称,是,检,验水平为 的检验,称 是检验法,的检,验水平。,7,定义1.1.,设 是(0,1)中的常数。如果对一切的,,有,就称,拒绝域W的检验水平,或,显著性水平,是 。,即:,检验法,可以被事件完全确定,事件发,生时拒绝 ,称,为,拒绝域,。,8,H,0,为真,H,0,为假,真实情况,所作判断,接受,H,0,拒绝,H,0,正确,正确,第一类错误,(弃真),第二类错误,(取伪),假设检验的两类错误,在解决假设检验的问题时, 无论作出否定还是接受原假设的决定, 都有可能犯错误.,我们称否定时犯的错误为,第一类错误, 接受时犯的错误为,第二类错误,.,9,假设检验一般控制第一类错误在检验水平以下, 所以,否定时结论比较可靠,。,如果,承认,,可能犯第二类错误,,错误概率可能会比较大,。,在正确的统计推断前提下, 犯错误的原因总是随机因素造成的。,要有效减少犯错误的概率, 只好增加观测数据,或在可能的情况下提高数据的质量,这相当于降低数据的样本方差.,10,在例1.1中, 如果第一起交通事故发生后, 就断定隧道南更容易发生交通事故, 犯第一类错误的概率是0.35.,当第二起交通事故发生后, 断定隧道南更容易发生交通事故, 犯第一类错误的概率是0.35,2,=0.1225.,如果第四起交通事故又发生在隧道南, 否定p=0.35时犯第一类错误的概率是0.35,4,=0.015.,11,例1.:,第一类错误与第二类错误的比较,一个有20多年教龄的教师声称他上课从来不“点名”. 如何判定他讲的话是真实的?,确立原假设H,0,: 他没有点过名, 然后再调查H,0,是否为真.,当调查了他教过的3个班, 都说他没有点过名, 这时如果承认H,0, 犯错误的概率还是较大的.,当调查了他教过的10个班, 都说他没有点过名, 这时承认H,0,犯错误的概率会明显减少。,如果调查了他教过的30个班, 都说他没有点过名, 这时承认H,0,犯错误的概率就会很小了。,可惜调查30个班是很难做到的!,12,反过来, 在调查中只要有人证实这位老师点过名, 就可以否定H,0,了(不论调查了几个班), 并且这样做犯错误的概率很小.,例1.2告诉我们, 要否定原假设H,0,是比较简单的, 只要观测到了H,0,下小概率事件就可以。,要承认H,0,就比较费力了: 必须有足够多的证据(样本量), 才能够以较大的概率保证H,0,的真实.,在这个例子中还有一个现象值得注意: 当调查10个班发现都没有点过名就承认H,0,时, 即使判断失误, 造成的后果也不严重. 因为数据已经说明这位老师不爱点名.,13,8.2 正态均值的假设检验,A.,已知,时,,的,正态检验法,例 2.1,:,一台方差是0.8克的自动包装机在流水线上包装净重500克的袋装白糖。随机抽取了包装的9袋白糖, 测得净重如下(单位:克):,499.12 499.48 499.25 499.53,500.82 499.11 498.52 500.01 498.87.,能否认为包装机在正常工作?,分析,: 抽查的9袋白糖中有7袋净重少于500克, 似乎净重,0,=500不对.,但是, 方差是0.8克, 也可能是由于包装机的随机误差导致了以上的数据.,14,下面的分析说明, 由于随机误差导致上述观测数据的概率不超过0.05.,将包装机包装的袋装白糖的净重视为总体,X,则,X N,(,2,),,其中,2,=0.8已知,,未知.,在H,0,下,|,Z,|取值应当与0差距不大。当|,Z|,取值较大时, 要否定H,0,.,用,X,j,表示第j袋白糖的净重, 则,X,1,X,2,X,9,是来自总体,X,的n=9个样本.,设,0,=500, 作假设,H,0,:,=,0,vs H,1,:,0,.,15,对于标准正态分布的上,/2分位数z,/2, 在H,0,下, P(|Z| z,/2,)=,。,本例中,如果取,=0.05, 则 z,/2,=1.96 ,P(|Z| 1.96)=0.05.,当|Z| 1.96时, 不该发生的小概率事件发生了, 于是否定原假设H,0,.,所以应当否定,H,0, 认为包装机没有正常工作.,16,在H,0,下, 检验统计量,解,:,设,0,=500, 作假设,H,0,:,=,0,vs H,1,:,0,.,查标准正态分布表, 得 z,/2,=1.96 ,拒绝域为:,所以应当否定,H,0, 认为包装机没有正常工作.,由于,17,在例2.1中,,称,为,检验的显著性水平, 简称为显著性水平, 检验水平, 或水平,(level,);,称Z为,检验统计量,;,称|Z| z,/2,为检验的,拒绝域,或,否定域,;,值得注意, 拒绝域是一个事件, 它的发生与否由|Z|, 从而由观测样本,X,1,X,2,.,X,n,决定.,如果|Z| z,/2,发生, 就称,检验是显著的,. 这时否定H,0, 犯第一类错误的概率不超过,; 检验水平就是犯第一类错误的概率.,18,其中,如果发生,就称,检验是显著的,.,如果,是来自总体 的样本.,已知时,,的显著性水平为的拒绝域是,这时,否定犯错误的概率不超过。,特别当时,,由于这种检验方法是基于正态分布的方法, 所以又称为,正态检验法,或,检验法,.,已知时,的,正态检验法,19,在例2.1中, 如果取检验水平,=0.04, 则临界值z,/2,=2.054 (查附录C1(续). 这时|Z|=1.972.054, 不能否定H,0,.,降低犯第一类错误的概率, 就会使得拒绝域减小,,从而拒绝 的机会变小,接受的机会变大。,说明,在不同的检验水平下可以得到不同的检验结果,.,20,在例2.1中, 从实际数据计算得到 |z|=1.97.,如果拒绝域取成 |Z| 1.97, 则刚刚能够拒绝H,0,.,这时犯第一类错误的概率是,P=P(|Z|1.97)=0.0488.,我们称P=0.0488是,检验的P值(P-value),.,B.,p值检验法,检验的P值,(P-value),是指在,H,0,成立的假设下根据已知观测, 被拒绝时最小的显著性水平,。,引入P值,可以使假设检验的结果更有意义。,21,如果,检验的显著性水平,是事先给定的, 当,P值小于等于, 就要否定H,0,.,检验法(2.1)的P值是P=P(|Z| |z|) =2,(-|z|).,P值是在H,0,成立的假设下观测到的样本倾向于 H,1,的概率。,P值越小, 数据提供的否定H,0,的证据越充分,。,22, ,0,0,0,0,0,Z,检验法 (,2,已知,),原假设,H,0,备择假设,H,1,检验统计量,拒绝域,23,C.,未知,时,均值,的,t,检验,法,例 2.2,:,在例2.1中如果9个袋装白糖的样品是从超级市场仓库中随机抽样得到的, 能否认为这批500克袋装白糖的平均重量是500克?,标准差,未知, 可用样本标准差,S,代替,.,分析,:,对,0,=500克, 仍作假设,H,0,:,=,0,vs,H,1,:,0,.,24,在,H,0,下, 从 7.3节的定理3.6知道检验统计量,说明在,H,0,下,T,在,0附近取值是正常的, 如果|,T,|取值较大就应当拒绝,H,0,.,根据分位数,t,/2,(,n,-1)的性质, 有,P,(|,T,|,t,/2,(,n,-1)=,.,于是,H,0,的显著性水平为,的拒绝域是,25,作出以上判断也有可能犯错误, 但是犯错误的概率不超过 0.05.,取,=0.05, 查表得到,t,0.05/2,(8)=2.306.,经过计算得到,|,T,|= 2.609 2.306,所以应当否定,H,0, 认为,500.,26,解,:,对,0,=500克, 假设,H,0,:,=,0,vs H,1,:,0,.,在H,0,下, 检验统计量:,取,=0.05, 查表得到t,0.05/2,(8)=2.306。拒绝域为:,经过计算样本标准差 S=0.676, |T|= 2.609 2.306。,所以应当否定H,0, 认为,500。犯错误的概率不超过 0.05.,27,其中,如果 发生,就称,检验是显著的。,如果,是来自总体 的样本.,未知时,,的显著性水平为的拒绝域是,这时,否定犯错误的概率不超过。,未知时,的,检验法,由于这种检验方法是基于t分布的方法, 所以又称为,t检验法,.,28,设统计量的计算结果为a,则检验法(2.3)的,值,为,其中,,29,例,2.1和例2.2都是检验:,当比大许多或小许多时,都应当否定原,假设。所以这种检验问题又被称为,双边检验,。,下面是,单边检验,问题,30,D.,未知,时,均值,的,单边检验法,例,2.3,:,在例,2.2中, 抽查的9袋白糖的平均重量为499.412克可以引起我们的怀疑. 这批袋装白糖的平均重量是否不足呢?,分析,:,为了解决这个问题, 我们提出假设,H,0,:,500 vs,H,1,:,500,如果否定了,H,0,,就认定这批袋装白糖的份量不足,由于在,H,0,下,不知道,的具体值, 所以检验统计量,的分布是未知的。,31,但是这时有,H,0,:,500 vs,H,1,:,500,因为,P,(,T,t,(,n-,1),P,(,T,0,t,(,n-,1)=,所以可以构造拒绝域为,T,t,(,n,-1),当,T,t,(,n,-1), 应当否定,H,0。,32,本例中,查表得到,t,0.05,(8)=1.86,经计算得,T,=2.6091.86,所以应当否定,H,0,,,认定这批袋装白糖的分量不足。,此时,犯第一类错误的概率不超过0.05。,本例中, 以为检验的拒绝域时, 刚刚可以拒绝。所以检验的,值,是,P=P()= 0.01560.05.,33,解,:,假设,H,0,:,500 vs H,1,:,500,在H,0,下, 检验统计量:,取,=0.05, 查表得到t,0.05,(8)=1.86。拒绝域为:,经过计算,样本标准差 S=0.676, 可知,T= 2.609 1.86。,所以应当否定H,0, 认为, 500,拒绝域为: ,经过计算可知, T=2.609,故,不拒绝,H,0 ,,即检验是,不显著,的。,35,分析例2.1和2.3的问题背景就会看出,在例2.1中应当作双边检验,因为多装和少装白糖都是不符合生产标准的,.,在,例2.3中只需要作单边检验,因为超市只需要知道袋装白糖不缺斤少两就够了,.,36,其中,如果 发生,就称,检验是显著的,。,如果,是来自总体 的样本.,未知时,,的显著性水平为的拒绝域是,这时,否定犯错误的概率不超过。,未知时,的单边,检验法(1),37,设统计量的计算结果为,则检验法(2.4)的,值,为,其中,,38,例2.4.,糕点厂经理为判断牛奶供应商所供应的鲜牛奶是否被兑水, 对它供应的牛奶进行了随机抽样检查. 测得12个鲜牛奶样品的冰点如下,-0.5426, -0.5467, -0.5360, -0.5281,-0.5444, -0.5468, -0.5420, -0.5347,-0.5468, -0.5496, -0.5410, -0.5405.,已知天然牛奶的冰点是-0.545摄氏度.,问牛奶是否被兑水.,分析:,设 n=12用 表示第 i 个样品的冰点, 则,是来自正态总体 的样本, 参 数 未知。,如果牛奶没有被兑水, 那么,39,根,据测量的数据可以计算出样本均值 0.5416, 样本方差 S = 0.0061.,由于水的冰点是摄氏度, 所以兑水牛奶的冰点将会提高。现在 0.545,于是有理由怀疑牛奶被兑水.,为了判定牛奶被兑水, 就要看牛奶没被对兑水时,=0.5416,S= 0.0061发生的概率有多大。设=0.545,作假设,如果否定了, 就判定牛奶被兑水。现在,40,查t分布表得,t,0,.,05,(11) = 1.796。,由于T 1.796, 检验是显著的, 所以否定,认为牛奶被兑水。,判断牛奶被兑水, 犯错误的概率不超过检验水平 。,本例中检验的,值,是,41,解:,根,据测量的数据可以计算出样本均值 0.5416, 样本方差 S = 0.0061。设=0.545,作假设,检验统计量,查t分布表得,t,0,.,05,(11) = 1.796。,经计算,T1.9308 1.796, 检验是显著的, 所以否定,认为牛奶被兑水。,判断牛奶被兑水, 犯错误的概率不超过检验水平。,42,其中,如果 发生,就称,检验是显著的,。,同理,如果,是来自总体 的样本. 未知时,,的显著性水平为的拒绝域是,这时,否定犯错误的概率不超过。,未知时,的单边,检验法(2),43,设统计量的计算结果为,则检验法(2.4)的,值,为,其中,,以上两种单边检验方法也称为,t 检验法,.,44,例,2.5:,某厂生产小型马达, 其说明书上写着: 这种小型马达在正常负载下平均消耗电流不会超过0.8 安培.,现随机抽取16台马达试验, 求得平均消耗电流为0.92安培, 消耗电流的标准差为0.32安培.,假设马达所消耗的电流服从正态分布, 取显著性水平为,= 0.05, 问根据这个样本, 能否否定厂方的断言?,分析,:由于,可知样本支持,考虑将,作备择假设,以便拒绝零假设,45,H,0,:,0.8 ;,H,1,:, 0.8,这里,, ,未知, 故,选检验统计量,:,查,t分布表得,t,0,.,05,(15) = 1.753, 得拒绝域:,经计算,T1.5,因此在水平0.05 下不能拒绝原假设,不能否认厂方断言。(即:在水平0.05 下认为平均消耗电流超过0.8安培是不显著的)。,解:,根据题意待检假设可设为,讨论1,:,如果从p值来看,,即使拒绝零假设,,否认厂方断言,犯错误的概率也不超过0.0772。,46,H,0,:,0.8 ;,H,1,:, 0.8,检验就更不显著了,不值得提倡。,这是因为拒绝域变为,T1.753。而现在 T1.5,因此更不能拒绝此零假设。,讨论3,:如果假设:,讨论2,:由于根据现有样本, ,但检验却没有拒绝 ,这是主要因为样本容量,n16还不够大,在水平0.05下现有证据还不足以得出显著性的结论。还需继续抽样。,从p值来看, 意味着拒绝零假设犯错误的概率极高,即:,承认厂方断言,犯错误的概率极高。,47,例,2.6,:,设某次概率统计考试考生的成绩,X N,(,2,),从中随机地抽取36位考生的成绩,算得平均成绩为66.5分,标准差为15分.,问在显著性水平,0.05下,是否可以认为这次考试的平均成绩为70分?并给出检验过程 .,解,:,根据题意假设为,查,t分布表得:,检验统计量,拒绝域为 ,|T|,2.0301.,48,故不拒绝,H,0,认为这次考试的平均成绩与,70分没有显著性差异。也即:,不否认,平均成绩为,70分。,经计算,,注意:,如果,接受,平均成绩为,70分,那么犯第二类错误的概率可能很大。,49, ,0,0,0,0,0,T 检验法,(,2,未知,),原假设,H,0,备择假设,H,1,检验统计量,拒绝域,50,作业,:,第,8章,8.3,8.6, 8.21。,51,
展开阅读全文