假设检验在统计方法中的地位

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,Statistics,假设检验在统计方法中的地位,参数估计,假设检验,统计方法,描述统计,推断统计,利用样本统计量去估计总体的参数,假设总体参数，用样本信息去检验这个假设是否成立,第,6,章假设检验,6.1,假设检验的基本问题,6.2,一个总体参数的检验,6.3,两个总体参数的检验,6.4,检验问题的进一步说明,学习目标,了解假设检验的基本思想,掌握假设检验的步骤,对实际问题作假设检验,利用,P,-,值进行假设检验,正常人的平均体温是,37,o,C,吗？,当问起健康的成年人体温是多少时，多数人的回答是,37,o,C,，这似乎已经成了一种共识。下面是一个研究人员测量的,50,个健康成年人的体温数据,37.1,36.9,36.9,37.1,36.4,36.9,36.6,36.2,36.7,36.9,37.6,36.7,37.3,36.9,36.4,36.1,37.1,36.6,36.5,36.7,37.1,36.2,36.3,37.5,36.9,37.0,36.7,36.9,37.0,37.1,36.6,37.2,36.4,36.6,37.3,36.1,37.1,37.0,36.6,36.9,36.7,37.2,36.3,37.1,36.7,36.8,37.0,37.0,36.1,37.0,正常人的平均体温是,37,o,C,吗？,根据样本数据计算的平均值是,36.8,o,C,，标准差为,0.36,o,C,根据参数估计方法得到的健康成年人平均体温的,95%,的置信区间为,(36.7,，,36.9),。研究人员发现这个区间内并没有包括,37,o,C,因此提出“不应该再把,37,o,C,作为正常人体温的一个有任何特定意义的概念”,我们应该放弃“正常人的平均体温是,37,o,C”,这个共识吗？本章的内容就将提供一套标准统计程序来检验这样的观点,6.1,假设检验的基本问题,6.1.1,假设问题的提出,6.1.2,假设的表达式,6.1.3,两类错误,6.1.4,假设检验的流程,6.1.5,利用,P,值进行决策,6.1.6,单侧检验,总体,假设检验的过程,抽取随机样本,均值,x,= 20,我认为人口的平均年龄是,50,岁,提出假设,拒绝假设,别无选择,!,作出决策,假设检验的基本思想,.,因此我们拒绝假设,= 50,.,如果这是总体的假设均值,样本均值,m,= 50,抽样分布,H,0,这个值不像我们应该得到的样本均值,.,20,假设检验,在假设检验中，一般要设立一个原假设；,而设立该假设的动机主要是企图利用人们掌握的反映现实世界的数据来找出假设和现实的矛盾，从而否定这个假设。,假设检验,在多数统计教科书中（除了理论探讨之外）,假设检验都是以否定原假设为目标。,如否定不了，那就说明证据不足，无法否定原假设。但这不能说明原假设正确。,很多教科书在这个问题上不适当地用“接受原假设”的说法，犯了明显的低级逻辑错误。,假设检验的过程和逻辑,首先要提出一个原假设，比如某正态总体的均值等于,5,（,m,=5,）。这种原假设也称为零假设（,null hypothesis,），记为,H,0,与此同时必须提出对立假设，比如总体均值大于,5,（,m,5,）。对立假设又称为备选假设或备择假设（,alternative hypothesis,）记为记为,H,1,或,H,a,假设检验的过程和逻辑,根据,零假设,（不是备选假设！），我们可以得到该检验统计量的分布；,然后再看这个统计量的数据实现值（,realization,）属不属于小概率事件。也就是说把数据代入检验统计量，看其值是否落入零假设下的小概率范畴,如果的确是小概率事件，那么我们就有可能拒绝零假设，否则我们说没有足够证据拒绝零假设。,假设检验的过程和逻辑,注意：,零假设和备选假设在我们涉及的假设检验中并不对称,。检验统计量的分布是从零假设导出的,因此,如果有矛盾,当然就不利于零假设了。,不发生矛盾也不说明备选假设有问题。,假设问题的提出,什么是假设,?,(,hypothesis,),对总体参数的的数值所作的一种陈述,总体参数包括总体均值、比例、方差等,分析之前必需陈述,我认为这种新药的疗效比原有的药物更有效,!,什么是假设检验,?,(,hypothesis testing,),事先对总体参数或分布形式作出某种假设，然后利用样本信息来判断原假设是否成立,有参数假设检验和,非,参数假设检验,采用逻辑上的反证法，依据统计上的小概率原理,小概率是在一次试验中，一个几乎不可能发生的事件发生的概率,在一次试验中小概率事件一旦发生，我们就有理由拒绝原假设,提出原假设和备择假设,什么是原假设？,(null hypothesis),1.,待检验的假设，又称“,0,假设”,2.,研,究者想收集证据予以反对的假设,3.,总是有等号,或,4.,表示为,H,0,H,0,：,某一数值,指定为,=,号，即,或,例如, H,0,：,3190,（克）,什么是备择假设？,(alternative hypothesis),与原假设对立的假设，也称“研究假设”,研究,者想收集证据予以支持的假设,总是有不等号,:,或,备择假设通常用于表达研究者自己倾向于支持的看法，然后就是想办法收集证据拒绝原假设，以支持备择假设，,表示为,H,1,H,1,：,某一数值，或, ,某一数值,例如, H,1,：, 3910(,克,),，或, ,3910(,克,),注意：,零假设和备选假设在我们涉及的假设检验中并不对称,。,提出原假设和备择假设,假设检验中的两类错误,(,决策风险,),两类错误与显著性水平,研究者总是希望能做出正确的决策，但由于决策是建立在样本信息的基础之上，而样本又是随机的，因而就有可能犯错误,原假设和备择假设不能同时成立，决策的结果要么拒绝,H,0,，要么不拒绝,H,0,。决策时总是希望当原假设正确时没有拒绝它，当原假设不正确时拒绝它，但实际上很难保证不犯错误,第,类错误,(,错误,),拒真错误,原假设为正确时拒绝原假设,第,类错误的概率记为,，,被称为显著性水平,第,类错误,(,错误,),纳伪错误,原假设为错误时未拒绝原假设,第,类错误的概率记为,(Beta),H,0,:,无罪,假设检验中的两类错误,(,决策结果,),陪审团审判,裁决,实际情况,无罪,有罪,无罪,正确,错误,有罪,错误,正确,H,0,检验,决策,实际情况,H,0,为真,H,0,为假,未拒绝,H,0,正确决策,(1 ,a,),第,类错误,(,b,),拒绝,H,0,第,类错误,(,a,),正确决策,(,1-,b,),假设检验就好像一场审判过程,统计检验过程,错误和,错误的关系,你要同时减少两类错误的惟一办法是增加样本容量,!,和,的关系就像翘翘板，,小,就大，,大,就小,两类错误的控制,一般来说，对于一个给定的样本，如果犯第,类错误的代价比犯第,类错误的代价相对较高，则将犯第,类错误的概率定得低些较为合理；反之，如果犯第,类错误的代价比犯第,类错误的代价相对较低，则将犯第,类错误的概率定得高些,一般来说，发生哪一类错误的后果更为严重，就应该首要控制哪类错误发生的概率。但由于犯第,类错误的概率是可以由研究者控制的，因此在假设检验中，人们往往先控制第,类错误的发生概率,检验能力,(power of test),拒绝一个错误的原假设的能力,根据,的定义，,是指没有拒绝一个错误的原假设的概率。这也就是说,，,1-,则是指拒绝一个错误的原假设的概率，这个概率被称为,检验能力,也被称为,检验的势或检验的功效,(power),可解释为正确地拒绝一个错误的原假设的概率,假设检验的流程,提出假设,确定适当的检验统计量,规定显著性水平,计算检验统计量的值,作出统计决策,什么是检验统计量？,1.,用于假设检验决策的统计量,2.,选择统计量的方法与参数估计相同，需考虑,是大样本还是小样本,总体方差已知还是未知,3.,检验统计量的基本形式为,确定适当的检验统计量,规定显著性水平,(,significant level,),什么是显著性水平？,1.,是一个概率值,2.,原假设为真时，拒绝原假设的概率,被称为抽样分布的拒绝域,3.,表示为,(alpha),常用的,值有,0.01, 0.05, 0.10,4.,由研究者事先确定,依据什么做出决策,？,若假设为,H,0,:,m,=500,，,H,1,:,m,500,。样本均值为,495,，拒绝,H,0,吗？样本均值为,502,，拒绝,H,0,吗？,做出拒绝或不拒绝原假设的依据是什么？,传统上，做出决策所依据的是样本统计量，现代检验中人们直接使用由统计量算出的犯第,类错误的概率，即所谓的,P,值,作出统计决策,计算检验的统计量,根据给定的显著性水平,，查表得出相应的临界值,z,或,z,/2,，,t,或,t,/2,，,F,或,F,/2,将检验统计量的值与,水平的临界值进行比较,得出拒绝或不拒绝原假设的结论,利用,P,值进行决策,检验统计量在零假设下,等于这个样本的数据实现值或更加极端值的概率称为,p,-,值（,p,-value,）,。,左侧检验时，,P,-,值为曲线上方,小于等于,检验统计量部分的面积,右侧检验时，,P,-,值为曲线上方,大于等于,检验统计量部分的面积,显然得到很小,p,-,值意味着小概率事件发生了。如果小概率事件发生，是相信零假设，还是相信数据呢？,当然是相信数据。于是就拒绝零假设。即，,若,p,值,不拒绝,H,0,若,p-,值,/2,不拒绝,H,0,若,p-,值,/2,拒绝,H,0,P,值是关于数据的概率,P,值反映的是在某个总体的许多样本中某一类数据出现的经常程度，它是当原假设正确时，得到目前这个样本数据的概率,比如，要检验全校学生的平均生活费支出是否等于,500,元，检验的假设为,H,0,：,=500,；,H,1,：,500,。,假定抽出一个样本算出的样本均值,600,元，得到的值为,P=0.02,，这个,0.02,是指如果平均生活费支出真的是,500,元的话，那么，从该总体中抽出一个均值为,600,的样本的概率仅为,0.02,。,如果你认为这个概率太小了，就可以拒绝原假设，因为如果原假设正确的话，几乎不可能抓到这样的一个样本，既然抓到了，就表明这样的样本不在少数，所以原假设是不对的,p,值越小，你拒绝原假设的理由就越充分,要证明原假设不正确，,P,值要多小，才能令人信服呢？,原假设的可信度有多高？如果,H,0,所代表的假设是人们多年来一直相信的，就需要很强的证据,(,小的,P,值,),才能说服他们,拒绝的结论是什么？如果拒绝,H,0,而肯定,H,1,，你就需要有很强的证据显示要支持,H,1,。比如，,H,1,代表要花很多钱把产品包装改换成另一种包装，你就要有很强的证据显示新包装一定会增加销售量,(,因为拒绝,H,0,要花很高的成本,),多大的,P,值合适,?,实际上，计算机软件仅仅给出,p-,值，而不给出,a,。这有很多方便之处。比如,a,=0.05,，而假定我们得到的,p-,值等于,0.001,。这时我们如果采用,p-,值作为新的显著性水平，即,a,=0.001,，于是可以说，我们拒绝零假设，显著性水平为,0.001,。拒绝零假设时犯错误的概率实际只是,千分之一而不是百分之五,。,在这个意义上，,p-,值又称为,观测的显著性水平（,observed significant level,）,。在统计软件输出,p-,值的位置，有的用“,p-,value”,，有的用,significant,的缩写“,Sig”,就是这个道理。,关于“临界值”的注：作为概率的显著性水平,a,实际上相应于一个检验统计量取值范围的一个临界值（,critical value,），,a,值定义为统计量取临界值或更极端的值的概率等于,a,。也就是说，“,统计量的实现值比临界值更极端”等价于“,p-,值小于,a,”,。,使用临界值的概念进行的检验不计算,p-,值。只比较统计量的取值和临界值的大小。,使用临界值而不是,p-,值来判断拒绝与否是前计算机时代的产物。当时计算,p-,值不易，只有采用临界值的概念。但从给定的,a,求临界值同样也不容易，好在习惯上仅仅在教科书中列出相应于特定分布的几个有限的,a,临界值（比如,a,=0.05,，,a,=0.025,，,a,=0.01,，,a,=0.005,，,a,=0.001,等等），或者根据分布表反过来查临界值（很不方便也很粗糙）。,现在计算机软件都不给出,a,和临界值，但都给出,p-,值和统计量实现值，让用户自己决定显著性水平是多少。,拒绝,H,0,P,值决策与统计量的比较,拒绝,H,0,的两个统计量的不同显著性,Z,拒绝,H,0,0,统计量,1,P,1,值,统计量,2,P,2,值,拒绝,H,0,临界值,双侧检验和单侧检验,双侧检验与单侧检验,(,假设的形式,),假设,研究的问题,双侧检验,左侧检验,右侧检验,H,0,m,=,m,0,m,m,0,m,m,0,H,1,m,m,0,m,m,0,双侧检验,(,原假设与备择假设的确定,),属于,决策中的假设检验,不论是大于,还是小于,，都必需采取相应的行动措施,例如，某种零件的尺寸，要求其平均长度为,10cm,，大于或小于,10cm,均属于不合格,我们想要证明,(,检验,),大于或小于这两种可能性中的任何一种是否成立,建立的原假设与备择假设应为,H,0,:,=,10 H,1,:,10,双侧检验,(,显著性水平与拒绝域,),抽样分布,H,0,值,临界值,临界值,a,/2,a,/2,样本统计量,拒绝域,拒绝域,1 -,置信水平,单侧检验,(,显著性水平与拒绝域,),H,0,值,临界值,a,样本统计量,拒绝域,抽样分布,1 -,置信水平,假设检验不能证明原假设正确,假设检验的目的主要是收集证据拒绝原假设，而支持你所倾向的备择假设,假设检验只提供不利于原假设的证据。因此，当拒绝原假设时，表明样本提供的证据证明它是错误的，当没有拒绝原假设时，我们也没法证明它是正确的，因为假设检验的程序没有提供它正确的证据,这与法庭上对被告的定罪类似：先假定被告是无罪的，直到你有足够的证据证明他是有罪的，否则法庭就不能认定被告有罪。当证据不足时，法庭的裁决是“被告无罪”，但这里也没有证明被告就是清白的,假设检验不能证明原假设正确,假设检验得出的结论都是根据原假设进行阐述的,我们要么拒绝原假设，要么不拒绝原假设,当不能拒绝原假设时，我们也从来不说“接受原假设”，因为没有证明原假设是真的,采用“接受”原假设的说法，则意味着你证明了原假设是正确的,没有足够的证据拒绝原假设并不等于你已经“证明”了原假设是真的，它仅仅意味着目前还没有足够的证据拒绝原假设，只表示手头上这个样本提供的证据还不足以拒绝原假设,“不拒绝”的表述方式实际上意味着没有得出明确的结论,假设检验不能证明原假设正确,“,接受”的说法有时会产生误导,这种说法似乎暗示着原假设已经被证明是正确的了,实事上，,H,0,的真实值我们永远也无法知道，不知道真实值是什么，又怎么能证明它是什么？,H,0,只是对总体真实值的一个假定值，由样本提供的信息也就自然无法证明它是否正确,采用“不拒绝”的表述方法更合理一些，因为这种表述意味着样本提供的证据不够强大，因而没有足够的理由拒绝，这不等于已经证明原假设正确,假设检验不能证明原假设正确,假设检验不能证明原假设正确,假设检验中通常是先确定显著性水平，这就等于控制了第,类错误的概率，但犯第,类错误的概率却是不确定的,在拒绝,H,0,时，犯第,类错误的概率不超过给定的显著性水平,，当样本结果显示没有充分理由拒绝原假设时，也难以确切知道第,类错误发生的概率,采用“不拒绝”而不采用“接受”的表述方式，在多数场合下便避免了,错误发生的风险,因为“接受”所得结论可靠性将由第,类错误的概率,来测量，而,的控制又相对复杂，有时甚至根本无法知道的值，除非你能确切给出,，否则就不宜表述成“接受”原假设,统计上显著不一定有实际意义,当拒绝原假设时，我们称样本结果是统计上显著的,(statistically Significant),当不拒绝原假设时，我们称样本结果是统计上不显著的,在“显著”和“不显著”之间没有清楚的界限，只是在,P,值越来越小时，我们就有越来越强的证据，检验的结果也就越来越显著,“,显著的”,(Significant),一词的意义在这里并不是“重要的”，而是指“非偶然的”,一项检验在统计上是“显著的”，意思是指：,这样的,(,样本,),结果不是偶然得到的,，或者说，,不是靠机遇能够得到的,如果得到这样的样本概率,(P),很小，则拒绝原假设,在这么小的概率下竟然得到了这样的一个样本，表明这样的样本经常出现，所以，样本结果是显著的,统计上显著不一定有实际意义,统计上显著不一定有实际意义,在进行决策时，我们只能说,P,值越小，拒绝原假设的证据就越强，检验的结果也就越显著,但,P,值很小而拒绝原假设时，并不一定意味着检验的结果就有实际意义,因为假设检验中所说的“显著”仅仅是“统计意义上的显著”,一个在统计上显著的结论在实际中却不见得就很重要，也不意味着就有实际意义,因为,P,值与样本的大小密切相关，样本量越大，检验统计量的,P,值也就越大，,P,值就越小，就越有可能拒绝原假设,统计上显著不一定有实际意义,如果你主观上要想拒绝原假设那就一定能拒绝它,这类似于我们通常所说的,“欲加之罪，何患无辞”,只要你无限制扩大样本量，几乎总能拒绝原假设,当样本量很大时，解释假设检验的结果需要小心,在大样本情况下，总能把与假设值的任何细微差别都能查出来，即使这种差别几乎没有任何实际意义,在实际检验中，不要刻意追求“统计上的”显著性，也不要把统计上的显著性与实际意义上的显著性混同起来,一个在统计上显著的结论在实际中却不见得很重要，也不意味着就有实际意义,6.2,一个总体参数的检验,6.2.1,总体均值的检验,6.2.2,总体比例的检验,6.2.3,总体方差的检验,第,6,章假设检验,6.2.1,总体均值的检验,(,大样本,),6.2,一个总体参数的检验,总体均值的检验,(,大样本,),1.,假定条件,大样本,(,n,30),2.,使用,z,检验统计量,2,已知：,2,未知：,总体均值的检验,(,2,已知,),(,例题分析,大样本,),【,例,6-4】,一种罐装饮料采用自动生产线生产，每罐的容量是,255ml,，标准差为,5ml,。为检验每罐容量是否符合要求，质检人员在某天生产的饮料中随机抽取了,40,罐进行检验，测得每罐平均容量为,255.8ml,。取显著性水平,=0.05,，检验该天生产的饮料容量是否符合标准要求？,双侧检验,绿色,健康饮品,绿色,健康饮品,255,255,总体均值的检验,(,2,已知,),(,例题分析大样本,),H,0,：,= 255,H,1,：,255,=,0.05,n,=,40,临界值,(,c,):,检验统计量,:,决策,:,结论,:,用,Excel,中的,【NORMSDIST】,函数得到的双尾检验,P=0.312945,不拒绝,H,0,没有证据表明该天生产的饮料不符合标准要求,z,0,1.96,-1.96,0.005,拒绝,H,0,拒绝,H,0,0.005,总体均值的检验,(z,检验,),(,P,值的计算与应用,),第,1,步：,进入,Excel,表格界面，直接点击,【,f,x,】,第,2,步：,在函数分类中点击,【,统计,】,，并在函数名,菜单下选择,【NORMSDIST】,，然后,【,确定,】,第,3,步：,将,z,的绝对值,1.01,录入，得到的函数值为,0.843752345,P,值,=2(1-,0.843752345,)=,0.312495,P,值远远大于,，故不拒绝,H,0,总体均值的检验,(,2,未知,),(,例题分析,大样本,),【,例,6-5】,一种机床加工的零件尺寸绝对平均误差为,1.35mm,。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低，从某天生产的零件中随机抽取,50,个进行检验。利用这些样本数据，检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低？,(,=0.01),左侧检验,50,个零件尺寸的误差数据,(,mm,),1.26,1.19,1.31,0.97,1.81,1.13,0.96,1.06,1.00,0.94,0.98,1.10,1.12,1.03,1.16,1.12,1.12,0.95,1.02,1.13,1.23,0.74,1.50,0.50,0.59,0.99,1.45,1.24,1.01,2.03,1.98,1.97,0.91,1.22,1.06,1.11,1.54,1.08,1.10,1.64,1.70,2.37,1.38,1.60,1.26,1.17,1.12,1.23,0.82,0.86,总体均值的检验,(,例题分析,大样本,),H,0,：,1.35,H,1,：,1.35,=,0.01,n,=,50,临界值,(,c,):,检验统计量,:,拒绝,H,0,新机床加工的零件尺寸的平均误差与旧机床相比有显著降低,决策,:,结论,:,-2.33,z,0,拒绝,H,0,0.01,总体均值的检验,(,P,值的计算与应用,大样本,),第,1,步：,进入,Excel,表格界面，直接点击,【,f,x,】,第,2,步：,在函数分类中点击,【,统计,】,，并在函数名的菜单下选,择,【,ZTEST,】,，然后,【,确定,】,第,3,步：,在所出现的对话框,【,Array】,框中，输入原始数据所,在区域；在,【,X,】,后输入参数的某一假定值,(,这里为,1.35,),；在,【,Sigma,】,后输入已知的总体标准差,(,若总,体标准差未知则可忽略不填，系统将自动使用样本,标准差代替,),第,4,步：,用,1,减去得到的函数值,0.995421023,即为,P,值,P,值,=,1-0.995421023=,0.004579,P,值,5200,=,0.05,n,=,36,临界值,(,c,):,检验统计量,:,拒绝,H,0,(,P,=,0.000088 ,= 0.05),改良后的新品种产量有显著提高,决策,:,结论,:,z,0,拒绝,H,0,0.05,1.645,总体均值的检验,(,z,检验,),(,P,值的图示,),抽样分布,P,=,0.000088,0,1.645,a,=,0.05,拒绝,H,0,1 -,计算出的样本统计量,=3.75,P,值,总体均值的检验,(,小样本,),1.,假定条件,总体服从正态分布,小样本,(,n,=0.05,，故不拒绝,H,0,总体均值的检验,(,用,SPSS,进行检验,小样本,t,检验,),第,1,步：,选择,【Analyze】,下拉菜单，并选择,【Compare MeansOne- Samples T Test】,选项，进入主对话框,第,2,步：,将检验变量,(,零件长度,),选入,【Test Variable(s)】,；在,【Test Value】,框内输入假设值,(,本题为,12),第,3,步：,点击,【,Options,】,，选择所需的置信水平,(,隐含值为,95%),。点击,【,Continue,】,回到主对话框。点击,【OK】,用,SPSS,进行检验,SPSS,总体均值的检验,(,用,SPSS,进行检验,小样本,t,检验,),不拒绝,H,0,。没有证据表明该供货商提供的零件不符合要求,一个总体均值的检验,(,作出判断,),是否已知,小,样本量,n,大,是否已知,否,t,检验,否,z,检验,是,z,检验,是,z,检验,6.2.2,总体比例的检验,6.2,一个总体参数的检验,总体比例检验,假定条件,总体服从二项分布,可用正态分布来近似,(,大样本,),检验的,z,统计量,0,为假设的总体比例,总体比例的检验,(,例题分析,),【,例,6-8】,一种以休闲和娱乐为主题的杂志，声称其读者群中有,80%,为女性。为验证这一说法是否属实，某研究部门抽取了由,200,人组成的一个随机样本，发现有,146,个女性经常阅读该杂志。分别取显著性水平,=0.05,和,=0.01,，检验该杂志读者群中女性的比例是否为,80%,？它们的,P,值各是多少？,双侧检验,总体比例的检验,(,例题分析,),H,0,：,= 80%,H,1,：,80%,= 0.05,n,=,200,临界值,(,c,):,检验统计量,:,拒绝,H,0,(,P,=,0.013328 ,= 0.01),没有证据表明,“,该杂志声称读者群中有,80%,为女性,”,的看法不正确,决策,:,结论,:,z,0,2.58,-2.58,0.005,拒绝,H,0,拒绝,H,0,0.005,6.2.3,总体方差的检验,6.2,一个总体参数的检验,总体方差的检验,(,2,检验,),检验一个总体的方差或标准差,假设总体近似服从正态分布,使用,2,分布,检验统计量,假设的总体方差,总体方差的检验,(,例题分析,),【,例,6-9】,啤酒生产企业采用自动生产线灌装啤酒，每瓶的装填量为,640,ml,，但由于受某些不可控因素的影响，每瓶的装填量会有差异。此时，不仅每瓶的平均装填量很重要，装填量的方差同样很重要。如果方差很大，会出现装填量太多或太少的情况，这样要么生产企业不划算，要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过,4,ml,。企业质检部门抽取了,10,瓶啤酒进行检验，得到的样本标准差为,s,=3.8,ml,。试以,0.05,的显著性水平检验装填量的标准差是否符合要求？,朝日,BEER,朝日,BEER,朝日,BEER,朝日,总体方差的检验,(,例题分析,),H,0,：,2,4,2,H,1,：,2,4,2,= 0.,10,df,=,10 - 1 = 9,临界值,(,s,):,统计量,:,不拒绝,H,0,(p=0.52185),没有证据表明装填量的标准差不符合要求,2,0,16.9190,=0.05,决策,:,结论,:,6.3,两个总体参数的检验,6.3.1,两个总体均值之差的检验,6.3.2,两个总体比例之差的检验,6.3.3,两个总体方差比的检验,第,6,章假设检验,6.3.1,两个总体均值之差的检验,6.3,两个总体参数的检验,两个总体均值之差的检验,(,独立大样本,),1.,假定条件,两个样本是独立的随机样本,正态总体或非正态总体大样本,(,n,1,30,和,n,2,30),2.,检验统计量,1,2,，,2,2,已知：,1,2,，,2,2,未知：,两个总体均值之差的检验,(,例题分析,独立大样本,),【,例,6-10】,某公司对男女职员的平均小时工资进行了调查，独立抽取了具有同类工作经验的男女职员的两个随机样本，并记录下两个样本的均值、方差等资料如右表。在显著性水平为,0.05,的条件下，能否认为男性职员与女性职员的平均小时工资存在显著差异？,两个样本的有关数据,男性职员,女性职员,n,1,=44,n,1,=32,x,1,=75,x,2,=70,S,1,2,=64,S,2,2,=42.25,两个总体均值之差的检验,(,例题分析,独立大样本,),H,0,：,1,-,2,= 0,H,1,：,1,-,2,0,=,0.05,n,1,=,44,，,n,2,=,32,临界值,(,c,):,检验统计量,:,决策,:,结论,:,拒绝,H,0,该公司男女职员的平均小时工资之间存在显著差异,z,0,1.96,-1.96,0.025,拒绝,H,0,拒绝,H,0,0.025,两个总体均值之差的检验,(,独立小样本：,1,2,，,2,2,已知,),假定,条件,两个独立的小样本,两个,总体都是正态分布,1,2,，,2,2,已知,检验,统计量,两个总体均值之差的检验,(,独立小样本：,1,2,，,2,2,未知但,1,2,=,2,2,),假定,条件,两个独立的小样本,两个,总体都是正态分布,1,2,、,2,2,未知但相等，即,1,2,=,2,2,检验,统计量,其中：,自由度：,两个总体均值之差的检验,(,独立小样本：,1,2,，,2,2,未知且不等,1,2,2,2,),假定,条件,两个,总体都是正态分布,1,2,，,2,2,未知且不相等，即,1,2,2,2,样本量不相等，即,n,1,n,2,检验,统计量,自由度：,两个总体均值之差的检验,(,例题分析,独立小样本，,1,2,=,2,2,),【,例,6-11】,甲、乙两台机床同时加工某种同类型的零件，已知两台机床加工的零件直径,(,单位：,cm),分别服从正态分布，并且有,1,2,=,2,2,。为比较两台机床的加工精度有无显著差异，分别独立抽取了甲机床加工的,8,个零件和乙机床加工的,7,个零件，通过测量得到如下数据。在,=0.05,的显著性水平下，样本数据是否提供证据支持,“两台机床加工的零件直径不一致”的看法？,两台机床加工零件的样本数据,(,cm,),甲,20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9,乙,20.7,19.8,19.5,20.8,20.4,19.6,20.2,两个总体均值之差的检验,(,例题分析,1,2,=,2,2,),H,0,：,1,-,2,=,0,H,1,：,1,-,2,0,=,0.05,n,1,=,8,，,n,2,=,7,临界值,(,c,):,检验统计量,:,决策,:,结论,:,不拒绝,H,0,没有证据表明,两台机床加工的零件直径不一致,t,0,2.160,-2.160,0.025,拒绝,H,0,拒绝,H,0,0.025,两个总体均值之差的检验,(,用,Excel,进行检验,),第,1,步：,将原始数据输入到,Excel,工作表格中,第,2,步：,选择,【,工具,】,下拉菜单并选择,【,数据分析,】,选项,第,3,步：,在,【,数据分析,】,对话框中选择,【,t-,检验：双样本,等,方,差假设,】,第,4,步：,当对话框出现后,在,【,变量,1,的区域,】,方框中输入第,1,个样本的数据区域,在,【,变量,2,的区域,】,方框中输入第,2,个样本的数据区域,在,【,假设平均差,】,方框中输入假定的总体均值之差,在,【,】,方框中输入给定的显著性水平,(,本例为,0.05,),在,【,输出选项,】,选择计算结果的输出位置，然后,【,确,定,】,进行检验,Excel,两个总体均值之差的检验,(,用,Excel,进行检验,),Excel,的输出结果,两个总体均值之差的检验,(,例题分析,独立小样本，,1,2,2,2,),【,例,6-12】,甲、乙两台机床同时加工某种同类型的零件，已知两台机床加工的零件直径,(,单位：,cm),分别服从正态分布，并且有,1,2,2,2,。为比较两台机床的加工精度有无显著差异，分别独立抽取了甲机床加工的,8,个零件和乙机床加工的,7,个零件，通过测量得到如下数据。在,=0.05,的显著性水平下，样本数据是否提供证据支持,“两台机床加工的零件直径不一致”的看法？,两台机床加工零件的样本数据,(,cm,),甲,20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9,乙,20.7,19.8,19.5,20.8,20.4,19.6,20.2,两个总体均值之差的检验,(,用,Excel,进行检验,),第,1,步：,将原始数据输入到,Excel,工作表格中,第,2,步：,选择“工具”下拉菜单并选择,【,数据分析,】,选项,第,3,步：,在,【,数据分析,】,对话框中选择,【,t-,检验：双样本,异,方,差假设,】,第,4,步：,当对话框出现后,在,【,变量,1,的区域,】,方框中输入第,1,个样本的数据区域,在,【,变量,2,的区域,】,方框中输入第,2,个样本的数据区域,在,【,假设平均差,】,方框中输入假定的总体均值之差,在,【,】,方框中输入给定的显著性水平,(,本例为,0.05,),在,【,输出选项,】,选择计算结果的输出位置，然后,【,确,定,】,进行检验,Excel,两个总体均值之差的检验,(,用,Excel,进行检验,),Excel,的输出结果,用,SPSS,进行检验,(,独立小样本，,1,2,=,2,2,；,1,2,2,2,),在用,SPSS,中进行检验时，需要把两个样本的观测值作为一个变量输入,(,本例为“零件尺寸”,),，然后设计另一个变量用于标记每个观测值所属的样本,(,本例为“机床”，,1,表示机床,1,，,2,表示机床,2),第,1,步：,选择,【,Analyze,】,【,Compare MeansIndependent-Samples T Test 】,进入主对话框,第,2,步：,检验变量,(,零件尺寸,),选入,【,Test Variable(s),】,将分组变量,(,机床,),选入,【,Grouping Variable(s),】,，并选择,【,Define Groups,】,，在,【Group1,后输入,1】,在,【Group2,后输入,2】,点击,【,Continue,】,回到主对话框。点击,【,OK,】,进行检验,SPSS,两个总体均值之差的检验,(,用,SPSS,进行检验,),ESPSS,的输出结果,Levenes Test for Equality of Variances,：检验两个总体方差相等的假设,两个总体均值之差的检验,(,配对,样本,),假定条件,两个总体配对差值构成的总体服从正态分布,配对差是由差值总体中随机抽取的,数据配对或匹配,(,重复测量,(,前,/,后,),检验统计量,样本差值均值,样本差值标准差,匹配样本,(,数据形式,),观察序号,样本,1,样本,2,差值,1,x,11,x,21,d,1,=,x,11,-,x,21,2,x,12,x,22,d,2,=,x,12,-,x,22,M,M,M,M,i,x,1,i,x,2,i,d,i,=,x,1,i,-,x,2,i,M,M,M,M,n,x,1,n,x,2,n,d,n,=,x,1,n,-,x,2,n,两个总体均值之差的检验,(,例题分析,配对样本,),【,例,6-13】,某饮料公司开发研制出一新产品，为比较消费者对新老产品口感的满意程度，该公司随机抽选一组消费者,(,8,人,),，每个消费者先品尝一种饮料，然后再品尝另一种饮料，两种饮料的品尝顺序是随机的，而后每个消费者要对两种饮料分别进行评分,(,0,分,10,分,),，评分结果如下表。取显著性水平,=0.05,，该公司是否有证据认为消费者对两种饮料的评分存在显著差异？,两种饮料平均等级的样本数据,旧饮料,5,4,7,3,5,8,5,6,新饮料,6,6,7,4,3,9,7,6,两个总体均值之差的检验,(,用,Excel,进行检验,配对样本,),第,1,步：,选择“,工具,”下拉菜单,，并,选择,【,数据分析,】,选项,第,3,步：,在分析工具中选择,【,t,检验：平均值成对二样本分析,】,第,4,步：,当出现对话框后,在,【,变量,1,的区域,】,方框内键入变量,1,的,数据区域,在,【,变量,2,的区域,】,方框内键入,变量,2,的数据区域,在,【,假设平均差,】,方框内键入假设的差值,(,这里为,0),在,【,】,框内键入给定的显著性水平，然后,【,确定,】,进行检验,Excel,配对总体均值之差的检验,(,用,Excel,进行检验,),Excel,的输出结果,两个总体均值之差的检验,(,用,SPSS,进行检验,配对样本,),第,1,步：,选择,【,Analyze,】,下拉菜单，并选择,【,Compare MeansPaired- Samples T Test,】,选项，进入主对话框,第,2,步：,将两个样本同时选入,【,Paired Variables,】,第,3,步：,点击,【,Options,】,，选择所需的置信水平,(,隐含值为,95%),。点击,【Continue】,回到主对话框。点击,【,OK,】,进行检验,SPSS,配对总体均值之差的检验,(,用,SPSS,进行检验,),SPSS,的输出结果,两个总体均值之差的检验,(TTEST,函数的应用,),函数语法：,TTEST(array1,array2,tails,type),说明：,【,Array1,】,为样本,1,的数据区域,【,array2,】,为样本,2,的数据区域,【,tails,】,表示分布曲线的尾数,如果,tails=1,，返回分布的单尾概率,如果,tails=2,，返回分布的双尾概率,【,type,】,为检验的类型,1,代表配对样本检验,1,代表双样本等方差假设,3,代表双样本异方差假设,用,TTEST,进行检验,Excel,两个总体均值之差的检验,(,方法总结,),6.3.2,两个比例均值之差的检验,6.3,两个总体参数的检验,1.,假定条件,两个,总体都服从二项分布,可以用正态分布来近似,2.,检验统计量,检验,H,0,：,1,-,2,=0,检验,H,0,：,1,-,2,=,d,0,两个总体比例之差的检验,两个总体比例之差的检验,(,例题分析,),【,例,6-14】,一所大学准备采取一项学生在宿舍上网收费的措施，为了解男女学生对这一措施的看法是否存在差异，分别抽取了,200,名男学生和,200,名女学生进行调查，其中的一个问题是：“你是否赞成采取上网收费的措施？”其中男学生表示赞成的比例为,27%,，女学生表示赞成的比例为,35%,。调查者认为，男学生中表示赞成的比例显著低于女学生。取显著性水平,=0.05,，样本提供的证据是否支持调查者的看法？,2,1,net,net,两个总体比例之差的检验,(,例题分析,),H,0,：,1,-,2,0,H,1,：,1,-,2, 0,=,0.05,n,1,=,200 ,n,2,=,200,临界值,(,c,):,检验统计量,:,决策,:,结论,:,拒绝,H,0,(,P,=,0.041837 8%,=,0.01,n,1,=,300 ,n,2,=,300,临界值,(,c,):,检验统计量,:,决策,:,结论,:,拒绝,H,0,(,P,= 1.22E-15,= 0.05),方法,1,的次品率显著低于方法,2,达,8%,，应采用方法,1,进行生产,-2.33,Z,0,拒绝域,6.3.3,两个

展开阅读全文

假设检验在统计方法中的地位

最新文档