资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,STAT,案例导入,案例一:时下不少大学生在一边学习的同时也不断寻找一些机会打些零工以赚点钱弥补学习和生活之需,这已经是学生们之间人所共知的事情。这没有丝毫的让人好奇之处,让人好奇的是这些打工的学生究竟一个月平均能赚多少钱?假设有人说:这个数据是,500,元,你觉得信不信它呢?当然,你首先需要收集证据,没有证据是肯定说明不了任何问题的。又假设有人通过组织调查取得过如下数据(调查到一共,30,人,单位:元):,第,7,章 假设检验,STAT,350 500 900 100 100 200 240 300 100 320,450 260 650 380 290 400 800 400 250 400,290 870 540 320 140 160 300 400 500 340,这时你该做何结论?就算是你得到以上数据的平均数等于,423,元,你是否就可以作出“是”或“不是”的回答?因为你要作出的回答是针对整个总体的,根据却又只是来自部分总体,即样本,所以事实上不论你最终作出的是“是”还是“不是”的回答其实都存在犯错误的可能。,第,7,章 假设检验,STAT,那么,如何以样本数据去对总体参数下结论才最科学最不容易犯错误呢?这就是一个属于单个总体参数假设检验的问题了,是本章需要解决的问题。,案例二:你可能认为每一个美国人都知道像这样一些简单历史问题的答案“在美国国旗上有多少颗星?有多少条条纹?星代表什么?条纹又代表什么?”。非常有意思的是,并非每一个人都知道问题的答案,而且当你知道问题的答案时,你也许会大吃一惊的。,第,7,章 假设检验,STAT,1998,年美国杂志,Todays America,就确实做过这么一个调查,所得到的数据肯定多多少少会出乎很多人的意料之外。下面就是按性别和美国地区列出的知道星的数目的成年人的百分比:,男士 女士 大城市 小城镇 农村,知道,72 72 57 56 31,不知道,22 34 25 16 15,第,7,章 假设检验,STAT,在纽约的伊利县里,200,个成人被问及在美国国旗上有多少颗星。上面的表现是属于每一类的成人的数目。样本的结果被计算两次,一次按性别算,另一次按回答问题的成人的住所算。,正确地回答问题的男士的百分比与女士的百分比之间有显著差别吗?大城市的成年人的百分比与小城镇的成年人的百分比之间有显著差别吗?小城镇的百分比与农村的百分比之间有显著差别吗?这样的问题属于两个总体参数假设检验问题,也将在本章学习。,STAT,本章重点,1,、假设检验的基本原理;,2,、假设检验的形式与种类;,3,、第一类错误与第二类错误;,4,、区间估计与假设检验的方法。,本章难点,1,、假设检验的基本原理;,2,、第一类错误与第二类错误。,第,7,章 假设检验,STAT,7.1,基本思想,统计假设检验是统计推断的基本问题之一。所谓“统计假设”指的是关于随机变量分布(或随机事件概率)的各种论断。这些假设可能产生于对随机现象的实际观察,也可能产生于对随机现象的理论分析。以后,用拉丁字母“,H”,,即英文,Hypothesis,(假设)的首字母表示统计假设。例如,对于某随机变量,X,的概率分布,可能提出多种假设:,H,:,X,服从正态分布;,H,:,X,服从普阿松分布。,第,7,章 假设检验,STAT,又如,实际经验以及概率论的一般理论都表明:如果,X,表示电子管的使用寿命或纤维的强度,则一般可以假设它服从正态分布;如果,X,是夏季发生大暴雨的次数,则一般可以假设它服从普阿松分布。,对于两个或两个以上随机变量,可以提出这样的假,设:,H,:它们有相同的分布;,H,:它们相互独立。,第,7,章 假设检验,STAT,对于随机变量,X,的分布参数,可以提出如下一些假设:,等等,其中 和 是已知数,而 和 是未知常数。,第,7,章 假设检验,STAT,所谓假设检验(也称显著性检验),就是根据对随机变量进行实际观察的结果(即样本取值)来判定事先给定的统计假设,H,是否成立的一种推断过程。,假设检验的思想颇为似类于司法程序中的“凭证定罪、疑罪从无”的做法,需要检验的假设往往是那些检验前被默认为正确的、除非具有充分证据否则不希望甚至不允许随便推翻的结论性语言。显著性水平之所以设得比较小,是为了一旦能够推翻就肯定有足够证据;但不能推翻却未必说明零假设成立。,第,7,章 假设检验,STAT,正因为此,我们说:假设检验有个显著特点,即“,信心满怀地拒绝,含含糊糊地接受,”。,参数估计与假设检验两种方法间虽有一定相似性,但本质性区别是:前者对总体一无所知,是求知一事物;后者则有所了解,是求证一事物。,第,7,章 假设检验,STAT,统计假设,关于随机变量(的分布、特征、相互关系等)的每一种论断都叫做统计假设。,一般地,根据问题的着眼点、条件和特点不同,统计假设有,参数假设,和,非参数假设、简单假设,和,复合假设、零假设,和,备择假设,之分。,(一)参数假设和非参数假设,假设,X,是所研究的随机变量。那么,在,X,的分布函数的数学形式已知的情形下,关于参数的各种统计假设称作“参数假设”;,第,7,章 假设检验,STAT,(二)简单假设和复合假设,如果一个统计假设完全决定随机变量的概率分布,或者说假设只针对参数在某一单点取值而作,称之为“简单假设”,否则便是“复合假设”。,(三)零假设和备择假设,假定关于,X,有两个统计假设,其中有且只有一个真实,称这样的两个假设为二者必居其一的。对于两个二者必居其一的假设,习惯上称其中一个为“零假设”,另一个为“备择假设”。,第,7,章 假设检验,STAT,7,统计假设的检验,考虑关于某个总体的统计假设 ,并以 表示它的“备择假设”。所谓对假设 的检验,就是根据随机取样的结果(即来自该总体的随机样本),按照一定的规则来判断假设 的真伪以决定它的取舍,即是“拒绝”还是“接受”假设 。以后,把用来判断所作假设真伪性的规则叫做检验准则,简称之为“检验”。,进行统计检验时,由于接受和拒绝领假设之间并没有截然的界限,使得容易犯如下两种类型的错误:,第,7,章 假设检验,STAT,第一类错误: 拒绝正确的原假设,简称“拒真”;,第二类错误 :接受错误的原假设,简称“纳伪”,我们把两类错误发生的概率表示如下:,第一类错误发生的概率;,第二类错误发生的概率;,总体情况,结论,H,0,正确,H,0,错误,接受,H,0,正确结论 第二类错误,拒绝,H,0,第一类错误 正确结论,第,7,章 假设检验,STAT,7.1.4,统计假设显著性检验的一般步骤:,假设随机变量,X,的分布函数,F,(,x,,,)依赖于未知参数,,以,x1,,,x2,,,,,xn,表示来自总体,X,的简单随机样本。统计假设显著性检验大致可分以下几步进行:,第一步:提出零假设,H,0,和备择假设,H,1,。零假设和备择假设一般可以表示为:,H,0,:,满足某某条件;,H,1,:,不满足上述条件。,第二步:规定检验的显著性水平,(,01,)。,第三步:建立零假设,H,0,的拒绝域。是样本空间的一个特定区域,满足条件:零假设成立时,样本点落入其中的概率不大于,。检验的拒绝域常借助一统计量,T,T,(,x,1,x,2,x,n,) 来构造,,T,的分布已知。,第,7,章 假设检验,STAT,第四步:对假设,H,0,作出推断。如果样本点 (,x,1,x,2,x,n,) 落入中,则认为,H,0,不真,从而拒绝它,否则便不拒绝假设,H,0,。,上述推断的依据是“小概率事件不发生”原则:由于样本点落入拒绝域的概率,“,很小”,故认为实际不可能落入中。因此,一旦确实落入则说明实际观测结果与所作假设,H,0,严重不符,所以理应拒绝假设,H,0,。,第,7,章 假设检验,STAT,7.2,单个总体,下面讨论具体的假设检验问题。由于正态分布的特殊性及其应用的广泛性,讨论在没有特别说明的条件下都默认为是就正态分布总体进行的。所讨论的检验方法同时也是实践中常用统计检验方法。,对于一个正态总体,我们考虑其数学期望和方差是否为某一特定值的检验问题;对于两个正态总体,考虑两者数学期望或方差是否相等的检验问题。由于比例问题完全可以看作是均值问题的特例,因此有关均值的所有结论适合于比例问题,除相关记号稍作调整外并无任何实质性区别,不予专门讨论。,第,7,章 假设检验,STAT,7.2.1,单个总体均值的检验,(一)总体标准差已知,检验(标准正态分布检验法)法,在已知标准差,0,时,检验假设,0,,使用检验:,零假设,H,0,:,0,(已知,0,);,备择假设,H1,:,0,(已知,0,);,显著性水平:,(,01,);,检验统计量:,第,7,章 假设检验,STAT,其中,是样本均值。由概率论理论得知:在假设,H,0,:,0,(已知,0,)下样本平均数 服从正态分布,N,(,0,0,2,/n,) ,从而统计量服从标准正态分布,N,(,0,,,1,)。,拒绝零假设的条件:对于给定的,,必可从标准正态分布表中查出一个正数(称之为标准正态分布的,水平双侧分位数) ,使下式成立:,P,0,|,| ,第,7,章 假设检验,STAT,例:设总体服从标准差为,50,的正态分布,从该总体中随机抽出容量为,25,的随机样本,得出样本平均值为,70,,试以,的显著性水平检验假设,H,0,:,0,90,。,解:建立假设,H0,:,0,;,H,1,:,0,因为,已知,该检验的统计量为:,将,70,,,0,90,,,50,,,n,25,代入,得:,2,;另一方面,查表得临界值。,|,,故拒绝零假设,H,0,,即有,95,的把握认为,不等于,90,。,第,7,章 假设检验,STAT,(二)总体标准差未知,t,检验,在标准差,(,0,)未知的情形下,检验假设,0,使用,t,检验:,零假设,H,0,:,0,,,0,;,备择假设,H,1,:,0,,,0.,显著性水平:,(,01,);,检验统计量:,第,7,章 假设检验,STAT,其中,是样本均值,,s,是(修正)样本标准差。由于在假设,H,0,下,尽管知道 的分布是正态分布,N,(,0,,,2,/n,),但因为,未知,,已不是统计量。改用,无偏估计,s,代替,然后再进行检验。不过,替代后的新统计量不再服从正态分布而服从,t,分布,,t,分布的自由度(参数)为,n-1,。,第,7,章 假设检验,STAT,例:某制造厂生产某装置的平均工作温度是,190,,今从一个由,16,台装置所构成的随机样本中求得的工作温度的平均数和标准差分别是,194,和,8,,能否说明平均工作温度与制造厂规定的温度不一致呢,?,(设, ,并假定工作温度服从正态分布),解:建立假设,H0 :,190,;,H1 :190,因方差未知,选取统计量,则,t,t,(,15,), (,15,)。将 ,194,,,0,190,,,s,8,,,n,16,代人计算得,:,第,7,章 假设检验,STAT,7.2.2,单个总体标准差的检验,(一)总体均值已知,检验假设,检验,零假设,H,0,:,( 已知);,备择假设,H,1,: ( 已知),显著性水平:,(,01,);,检验统计量:由于,x,1,x,2,x,n,独立且同为正态分布,则,、 、,、,独立且同为标准正态分布,故由其平方和构成的统计量服从自由度为,n,的分布;,拒绝零假设的条件:对于给定的显著性水平,和自由度,n,,有,:,第,7,章 假设检验,STAT,其中,记 是自由度为,n,的分布的,水平下侧分位数,,为其上侧分位数。当如下不等式成立时,我们拒绝零假设:,或,第,7,章 假设检验,STAT,(二)总体均值未知,检验假设,检验,零假设,H,0,:,; 备择假设,H,1,:,显著性水平:,(,01,);,检验统计量:,拒绝零假设的条件:对于给定的显著性水平,和自由度,n,,有,:,第,7,章 假设检验,STAT,其中 和 的含义与前面相似。,当如下不等式成立时,我们拒绝零假设:,或,第,7,章 假设检验,STAT,例:由某个正态分布总体抽出一个容量为,21,的随机样本,样本方差为,10,。试检验假设 ,15,。(,),解:建立假设,H,0,:,15,;,H,1,: ,15,由于总体服从方差未知的正态分布,应选择检验的统计量为:,将,n,21,, ,10,, ,15,代人计算,得 ,另一方面,,(,n,1,),查分布表,可得,, 。,第,7,章 假设检验,STAT,7.3,两个总体,因为 ,故接受零假设,即没有,95,的把,握认为 ,15,。,第,7,章 假设检验,STAT,7.3.1,对均值的检验,(一)总体标准差已知,检验两总体均值是否相等,检验,假设随机变量,x,N,(,1,),,y,N,(,2,),其中和为已知参数,而和为未知参数。欲检验和是否相等的问题,使用检验:,零假设,H,0,: ( 和 已知);,备择假设,H,1,: ( 和 已知);,显著性水平:,(,0,,故拒绝零假设,即有,95,的把握认为平均抗拉强度不同。,(二)总体标准差未知,检验两总体均值是否相等,t,检验,零假设,H,0,: (,0,);,备择假设,H,1,: (,0,),显著性水平:,(,0 t,/2,(,m,n,2,),故拒绝零假设,即有,95,的把握认为钢圈内径不一致。,第,7,章 假设检验,STAT,7.3.2,对两个总体标准差的检验,检验假设 ,F,检验(无论均值已知与否),零假设,H,0,:, , ,备择假设,H,1,: , , ,显著性水平:,(,01,);,检验统计量:,其中: 和 分别为,X,和,Y,的(修正)样本方差。由概率论知统计量服从,F,分布,自由度为(,m-1,,,n-1,)。对于给定的,和自由度(,m-1,,,n-1,),有:,第,7,章 假设检验,STAT,其中:记 为自由度为(,m-1,,,n-1,)的,F,分布,水平下侧分位数, 为上侧分位数,查,F,分布表可得其值。因此,如下不等式成立时,拒绝零假设:,或,例:两种羊毛织品的强度服从正态分布。分别抽取容量为,4,和,6,的两个样本进行检验,结果为 , ,是否可以认为两个样本方差同质,?,(,),第,7,章 假设检验,STAT,解:建立假设,H,0,: ,,H,1,: ,;,依题意,选择检验统计量,一方面实际,F,值为:,F,;另一方面查,F,分布表可得,F,的理论临界值:,F,1,(,3,,,5,),,F,(,3,,,5,),因,故接受零假设,即没有,95,的把握认为 。,第,7,章 假设检验,
展开阅读全文