统计学-第4章-假设检验课件

上传人:沈*** 文档编号:241990248 上传时间:2024-08-09 格式:PPT 页数:116 大小:1.08MB
返回 下载 相关 举报
统计学-第4章-假设检验课件_第1页
第1页 / 共116页
统计学-第4章-假设检验课件_第2页
第2页 / 共116页
统计学-第4章-假设检验课件_第3页
第3页 / 共116页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第4章 假设检验,假设检验在统计方法中的地位,统计方法,描述统计,推断统计,参数估计,假设检验,参数估计与假设检验的关系,参数估计和假设检验是推断统计方法的两个重要组成部分。,共同点:都是利用样本信息对总体数量特征进行推断。,不同点:推断的角度不同。,参数估计,是用样本统计量估计总体参数,总体参数在估计前是未知的。,假设检验,是先对总体参数的值提出一个原假设,然后利用样本信息来检验和判断这个原假设是否成立(即判断样本信息与原假设之间是否存在显著差异)。若成立,我们就接受原假设;不成立,就拒绝原假设。,【,例,1】,某牙膏厂用自动包装机装牙膏,正常情况下,每支牙膏内装入的牙膏量(单位:,g,),X,N,(50,1.2,2,),,某日从生产中随机地抽取,16,支牙膏,测得平均每支牙膏的净重为,50.72g,,问这天包装机是否正常?,【,分析,】,如果包装机工作正常,那么牙膏量,X,N,(50,1.2,2,),,现在问包装机工作是否正常,在假定方差不变的情况下,实际上就是要通过样本均值来检验总体均值,50,是否正确。这就是一个假设检验问题。,【,例,2】,某种装袋食品,按规定每袋重量不得少于,250g,。从一批产品中随机抽取,50,袋,发现有,6,袋重量低于,250g,。若规定不符合标准的比例达到,5%,,食品就不得出厂,问该批食品能否出厂?,【,分析,】,对于该批食品的不合格率我们事先并不知道,要根据样本的不合格率估计该批食品的不合格率,然后与规定的不合格率标准,5%,进行比较,作出该批食品能否出厂的决策。也就是说,我们先假设该批食品的合格率不超过,5%,,然后用样本不合格率来检验假设是否正确?这也是一个假设检验问题。,4,.1,假设检验的基本问题,一、假设检验的概念,什么是假设检验,?,假设检验,是指,先对总体的参数或分布形式提出某种假设,然后利用样本信息判断假设是否成立的过程;,包括参数检验和,非,参数检验;,逻辑上运用的是概率反证法;,统计依据为小概率原理。,小概率原理,小概率事件,若事件,A,发生的概率,P(A),很小很小或接近于,0,。一般在假设检验中,通常要求,P(A)0.05,。,严格说来,小概率事件并非不可能事件,但是小概率事件在一次试验中几乎是不可能发生的,实践中可以将其看作是不可能事件。,小概率原理是假设检验的灵魂。任何假设检验都是根据这一基本原理、基本思想为基础的。,总体,假设检验的过程,抽取随机样本,均值,x,=20,我认为人口的平均年龄是,50,岁,提出假设,拒绝假设,别无选择,!,作出决策,二、原假设与备择假设,什么是假设,?,对总体参数的具体数值所作的陈述,总体参数包括总体均值、总体比率、总体方差等,分析之前必须陈述,我认为这种新药的疗效比原有的药物更有效,!,原假设,原假设,又称零假设,,是指研,究者想收集证据予以反对的假设,,,表示为,H,0,。,总是有符号,、,或,,,例如,,H,0,:,10cm,H,0,:,10cm,H,0,:,10cm,备择假设,也称研究假设,,,是指研究,者想收集证据予以支持的假设,,表示为,H,1,。,总是有符号,、,或,例如,,H,1,:,10cm,H,1,:,10cm,H,1,:,10cm,备择假设,一种零件的生产标准是直径应为,15mm,,,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于,15mm,,,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设,提出假设例,1,【,解,】,研究者想收集证据予以证明的假设应该是生产过程不正常。,因此,建立的原假设和备择假设为,H,0,:,=15mm,H,1,:,15mm,某品牌洗涤剂在它的产品说明书中声称:,平均净含量不少于,500,克。从消费者的利,益出发,有关研究人员要通过抽检其中,的一批产品来验证该产品制造商的说明,是否属实。试陈述用于检验的原假设与,备择假设。,500g,提出假设例,2,【,解,】,研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。,因此,建立的原假设和备择假设为,H,0,:,500,H,1,:,30%,原假设和备择假设是一个完备事件组,而且相互对立。在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立;,先确定备择假设,再确定原假设。因为,备择假设大多是人们关心并想予以支持和证实的,一般比较清楚和容易确定,;,等号,“,=,”,总是放在原假设上;,因研究目的不同,对同一问题可能提出不同的假设,也可能得出不同的结论。,假设检验主要是搜集证据来推翻和拒绝原假设。,结论与建议,三、双侧检验与单侧检验,双侧检验,是指备择假设没有特定的方向性,并含有符号,的假设检验,又称为双尾检验。,单侧检验,是指备择假设具有特定的方向性,并含有符号,或,的假设检验,又称为单尾检验。,备择假设的方向为,,称为右侧检验,概念,假设的形式,假设,双侧检验,单侧检验,左侧检验,右侧检验,原假设,H,0,:,m,=,m,0,H,0,:,m,m,0,H,0,:,m,m,0,备择假设,H,1,:,m,m,0,H,1,:,m,m,0,四、两类错误与显著性水平,假设检验的目的是要根据样本信息作出最终决策。研究者总想作出正确的决策,但由于决策是建立在样本信息的基础之上的,而样本又是随机的,因而就有可能犯错误。经常犯的错误有以下两种:,当原假设正确时,拒绝它;,当原假设错误时,没有拒绝它。,概念,第,类错误,(,弃真错误,),原假设为真时拒绝原假设。,第,类错误的概率记为,,又被称为显著性水平。,第,类错误,(,取伪错误,),原假设为假时未拒绝原假设。,第,类错误的概率记为,。,和,的关系,你不能同时减少两类错误,!,和,的关系就像翘翘板,,小,就大,,大,就小,理想地,只有增加样本容量,能同时减小犯两类错误的概率,但增加样本容量又受到很多因素的限制;,通常,只能在两类错误的发生概率之间进行平衡,发生哪一类错误的后果更为严重,就首要控制哪类错误发生的概率;,在假设检验中,一般先控制,第,类错误,的发生概率。因为犯,第,类错误,的概率是可以由研究者控制的。,第,类错误,又称为显著性水平,常被用于检验结论的可靠性度量,;,既,是一个概率值;又,是,抽样分布拒绝域面积的大小(表示犯,第,类错误概率的最大允许值,);,常用的,值有,0.01,,,0.05,,,0.10,;,由研究者事先确定。,第,类错误,确定了显著性水平,就等于控制了,第,类错误,的概率,但犯,第,类错误概率,的具体数值,却很难确定,其受影响因素包括:,随假设总体参数的减少而增大;,当,减少时增大;,当,增大时增大;,当,n,减少时增大。,五、检验统计量与拒绝域,检验统计量,是指根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量。,检验统计量实际上是总体参数的点估计量,只有将其标准化后,才能用于度量它与原假设的参数之间的差异程度。,标准化的检验统计量,可表示为:,检验统计量,拒绝域,是指能够拒绝原假设的统计量的所有可能取值构成的集合。,大小等于显著性水平,。,位置取决于检验是单侧还是双侧。双侧拒绝域在分布两侧;单侧拒绝域在左侧或右侧。,临界值,根据给定的显著性水平确定的拒绝域的边界值。,拒绝域与临界值,双侧检验图示,0,临界值,临界值,a,/2,a,/2,拒绝域,拒绝域,1-,置信水平,左侧检验图示,0,临界值,a,拒绝域,1-,置信水平,右侧检验图示,0,临界值,a,拒绝域,1-,a,置信水平,决策步骤,给定显著性水平,,,查表得出相应的临界值,z,或,z,/2,,,t,或,t,/2,将计算出的检验统计量的值与,临界值比较,作出决策,双侧检验:,|,统计量,|,临界值,拒绝,H,0,左侧检验:,统计量,临界值,拒绝,H,0,六、利用,p,值进行决策,显著性水平,是在检验之前确定的,这也就意味着事先确定了拒绝域。这样,不论检验统计量的值是大是小,只要它落入拒绝域就拒绝原假设,否则就不拒绝原假设。,这种固定的显著性水平对检验结果可靠性的度量有两个不足之处:,它只是一个大致的范围;,对不同的检验,当,相同时,所有结论的可靠性都一样。,要想得出观测数据与原假设之间不一致程度的精确度量,就需要计算,p,值。,关于,p,值,p,值,又称为观察到的显著性水平,,在原假设为真的条件下,所得到的样本结果会像实际观测结果那么极端或更极端的概率。,是指原假设正确时被拒绝的概率,或拒绝原假设犯错误的最大允许值;,p,值与原假设的对或错的概率无关,它是关于数据的概率。如果原假设正确,,p,值表示这样的观测数据会有多么的不可能得到。或是犯错误的实际概率。,不论是单侧检验还是双侧检验,用,p,值进,行,决策的规则:,若,p,值,,,不拒绝,H,0,p,值,反映实际观测到的数据与原假设,H,0,之间不一致的程度的一个概率值。,p,值越小,说明实际观测到的数据与原假设,H,0,之间不一致的程度就越大,检验的结果也就越显著。,双侧检验,/,2,/,2,Z,0,临界值,计算出的统计量,计算出的统计量,临界值,1/2,p,值,1/2,p,值,左侧检验,0,临界值,a,1-,置信水平,计算出的统计量,p,值,右侧检验,0,临界值,a,1-,置信水平,计算出的统计量,p,值,假设检验步骤,1,、提出原假设和备择假设;,2,、确定一个适当的检验统计量,并利用样本数据算出其具体数值;,3,、根据显著性水平,计算出其临界值,指定拒绝域;,4,、将统计量的值与临界值进行比较,作出决策。,统计量的值落在拒绝域,拒绝,H,0,,,否则不拒绝,H,0,也可以直接利用,p,值作出决策,4,.,2,一个正态总体的检验,一个正态总体参数的检验,z,检验,t,检验,z,检验,2,检验,均值,一个总体,比例,方差,一、总体均值的检验,总体均值的检验,(,作出判断,),样本容量大小,未知,总体方差是否已知,已知,无论样本容量大小,小,t,检验,z,检验,大,z,检验,1,、总体方差已知的检验,根据抽样分布的知识,对于正态总体,当总体方差已知的情况,无论样本是大样本,还是小样本,时,,都,使用,z,检验统计量。,【,例,1】,某厂生产铜丝,其主要质量指标为折断力,X,,根据历史资料统计,可假定,X,N,(570,8,2,),。今新换材料生产,抽取,30,个样本值为:,577,、,578,、,579,、,569,、,565,、,577,、,568,、,587,、,578,、,572,、,570,、,568,、,572,、,581,、,582,、,569,、,570,、,570,、,572,、,596,、,584,,,598,、,588,、,563,、,577,、,587,、,567,、,587,欲检验新材料生产的铜丝的折断力,X,有无明显变化。假定方差,2,=8,2,保持不变,,=0.05,【,解,】,此题为正态总体均值的假设检验,H,0,:=570,H,1,:,570,由于铜丝折断力,X,为大样本且总体方差已知,故可以采用,Z,检验法。,依题意,样本均值为:,检验统计量,=0.05,,查表得,Z,/2,=1.96,检验统计量,|,Z|=21.64,Z,/2,=1.96,所以应拒绝,H,0,,表明新材料生产的铜丝的折断力,X,有明显的变化。,双侧检验,0,1.96,-1.96,0.025,0.025,拒绝,H,0,拒绝,H,0,0.95,置信水平,【,练习,1】,完成生产线上某件工作所需的平均时间不少于,15.5,分钟,标准差为,3,分钟,对随机抽选的,36,名职工讲授一种新方法,训练期结束后这,36,名职工完成此项工作所需的平均时间为,13.5,分钟,这个结果是否提供了充分证据,说明用新方法所需的时间短?设,=0.05,,并假定完成这件工作的时间服从正态分布。,H,0,:,15.5 H,1,:,15.5,由于大样本且总体方差已知,故采用,Z,检验法。依题意已知:,检验统计量,=0.05,,临界值,Z,=1.645,Z,=-4,18.3,由于大样本且总体方差已知,故可用,Z,检验法,依题意样本均值,检验统计量为:,当,=0.05,时,查表得,Z,=1.645,因为,Z=0.659,Z,=1.645,所以不拒绝原假设,H,0,,即没有充分的理由相信尼古丁含量增加了。,右侧检验,0,1.645,0.05,拒绝,H,0,0.95,置信水平,总体方差已知,,检验方法的总结,假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,m,=,m,0,H,1,:,m,m,0,H,0,:,m,m,0,H,1,:,m,m,0,统计量,无论样本容量,大小,拒绝域,P,值决策,拒绝,H,0,2,、总体方差未知的检验,根据抽样分布知识,当总体服从正态分布,但总体方差未知时,样本容量的大小决定了所用的,检验统计量,,大样本,小样本,【,例,2】,某车床加工一种零件,要求其长度为,150mm,,现从一批加工后的这种零件中随机抽取,9,个,测得其长度为:,147,、,150,、,149,、,154,、,152,、,153,、,148,、,151,、,155,如果零件长度服从正态分布,问这批零件是否合格?(,=0.05,),【,解,】,所要检验的假设为:,H,0,:,=150 H,1,:,150,根据题中数据,计算样本均值和样本标准差分别为:,又知,n=9,50,依题意:,又知总体服从正态分布,总体方差,未知,且,n=16,30),,故采用,Z,检验法。所要检验的假设为:,H,0,:,21,H,1,:,21,检验统计量,Z,的计算如下:,当,=0.05,时,查,Z,分布表得出临界值为:,因为:,所以不拒绝,H,0,,可以认为该批罐头中维生素,C,的含量合乎标准。,左侧检验,0,-1.645,0.05,拒绝,H,0,0.95,置信水平,样本统计量,总体方差未知,检验方法小结,假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,m,=,m,0,H,1,:,m,m,0,H,0,:,m,m,0,H,1,:,m,m,0,统计量,大样本,小样本,拒绝域,P,值决策,拒绝,H,0,二、总体比率的检验,我们只研究在大样本情况下的总体比例的检验。根据抽样分布知识,在大样本情况下,总体比例可用正态分布来近似。检验可用,z,统计量,【,例,3】,某公司经理希望估计一下其所在城市居民参加财产保险的比例。业务科长认为大约有,80%,的居民参加了财产保险,而统计科统计人员随机调查了,150,户居民了解到有,70%,的居民参加了财产保险。经理希望在,=0.05,的显著性水平下检验一下业务科长的说法是否可信?,依,题意,可建立如下假设,H,0,:,=0.8 H,1,:,0.8,又知样本比例,p,=0.7,,,n,=105,30,,属于大样本,故采用,Z,检验法。检验统计量为:,=0.05,,查表得出临界值,因为,所以应拒绝,H,0,,由此可以判定业务科长的说法不可信,即参加保险的户数不足,80%,。,【,练习,5】,某生产商向供应商购一批西红柿,双方规定若优质西红柿的比例在,40%,及以上按一般市场价格收购,否则按低于市场价格收购。现随机抽取了,100,个西红柿,只有,34,个为优质品。于是,生产商欲按低于市场价格收购,而供应商则认为样本比例不足,40%,是由随机因素引起的。请用,=0.05,进行检验并加以说明。,依,题意,可建立如下假设,H,0,:P0.4 H,1,:P,30,,属于大样本,故采用,Z,检验法。,检验统计量为:,当,=0.05,时,查表得出左侧检验临界值:,因为:,所以不拒绝原假设,H,0,,即根据样本数据还不能认为优质西红柿的比例显著地低于,40%,,故而生产商仍应按一般市场价格收购。,大样本总体比例的检验小结,假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,=,0,H,1,:,0,H,0,:,0,H,1,:,0,统计量,拒绝域,P,值决策,拒绝,H,0,三、总体方差的检验,根据抽样分布知识,检验一个总体的方差或标准差,通常假设总体近似服从正态分布,使用,2,分布。其检验统计量为:,【,例,4】,已知某种零件的尺寸服从,N,(23.02,,,1.5,2,),现从这批零件中任取,7,件进行测量,测得尺寸数据(单位:,mm,)如下:,21.00 22.04 22.32 24.01,24.68 25.02 21.63,能否认为该批零件的方差是否和以往一样?(,=0.05,),依题意可归结为以下假设:,H,0,:,=1.5,2,H,1,:,1.5,2,,,由于总体服从正态分布,采用,检验。,又知,检验统计量为:,=0.05,,查,分布表得:,/2,(n-1)=14.449,1-/2,(n-1)=1.237,因为,1-/2,=1.237=6.7549,/2,=16.013,所以不拒绝原假设,H,0,,可以认为该批零件的方差和以往是一样的。,【,练习,6】,某车间生产的金属丝,质量一贯稳定,折断力服从正态分布,方差,=64,,今从一批金属铜丝中随机抽取,10,根作折断力试验,结果为:,578,、,572,、,570,、,568,、,572,、,570,、,596,、,584,、,570,、,572,。,(样本均值约为,575,),问:这批金属丝折断力的方差为,64,是否可信?(,=0.05,),待检验假设为:,H,0,:,=64 H,1,:,64,由于总体服从正态分布,故采用,检验。又知,检验统计量为:,当,=0.05,,查,分布表得:,/2,(n-1)=,0.025,(9)=19.023,1-/2,(n-1)=,0.975,(9)=2.700,因为:,1-/2,=2.700,2,=10.65,/2,=19.023,所以不拒绝,H,0,,可以认为这批金属铜丝的折断力的方差为,64,可信。,单个正态总体方差的检验小结,假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,2,=,0,2,H,1,:,2,0,2,H,0,:,2,0,2,H,1,:,2,0,2,统计量,拒绝域,或,P,值决策,拒绝,H,0,4,.,3,两个正态总体参数的检验,两个总体参数的检验,两个总体参数的检验,z,检验,(,大样本,),t,检验,(,小样本,),t,检验,(,小样本,),z,检验,F,检验,独立样本,成对样本,均值之差,比例之差,方差之比,一、两个正态总体均值差的检验,1,、两个独立总体,方差都已知,两个样本是独立的随机样本,,且两个正态总体的方差均已知,时,其,检验统计量,【,例,1】,某公司对男女职员的平均小时工资进行了调查,独立抽取了男女职员的两个随机样本,并记录两个样本的均值、容量如下表。在显著性水平为,0.05,的条件下,能否认为男职员与女职员的平均小时工资存在显著差异?已知两总体服从正态分布,且方差分别为,64,和,42.25,男性职员,女性职员,n,1,=44,n,1,=32,x,1,=75,x,2,=70,H,0,:,1,-,2,=0,H,1,:,1,-,2,0,=,0.05,n,1,=,44,,,n,2,=,32,临界值,(,c,):,检验统计量,:,决策,:,拒绝,H,0,结论,:,该公司男女职员的平均小时工资之间存在显著异,z,0,1.96,-1.96,0.025,拒绝,H,0,拒绝,H,0,0.025,【,练习,1】,甲、乙两台机床同时加工某种同类型的零件,已知两台机床加工的零件直径分别服从正态分布,且有,1,2,=40,,,2,2,=28,。为比较两台机床的加工精度有无显著差异,分别独立抽取了甲机床加工的,8,个零件和乙机床加工的,7,个零件,通过测量得到如下数据。在,=0.05,的显著性水平下,样本数据是否提供证据支持两台机床加工的零件直径不一致的看法?,两台机床加工零件的样本数据,(,cm,),甲,20,19,17,24,21,20,19,18,乙,21,19,15,20,24,16,20,H,0,:,-,2,=,0,H,1,:,1,-,2,0,=,0.05,n,1,=,8,,,n,2,=,7,临界值,c,检验统计量,:,决策,:,结论,:,不拒绝,H,0,没有理由认为甲、乙两台机床加工的零件直径有显著差异,Z,0,1.96,-1.96,0.025,拒绝,H,0,拒绝,H,0,0.025,两个独立正态方差已知总体均值差检验,假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,m,1,-,m,2,=,0,H,1,:,m,1,-,m,2,0,H,0,:,m,1,-,m,2,0,H,1,:,m,1,-,m,2,0,统计量,拒绝域,P,值决策,拒绝,H,0,2,、两个独立总体,方差未知但相等,当两个独立的正态总体,方差都未知,却相等的情况下,检验,统计量用自由度为,n,1,+,n,2,-2,的,t,统计量,3,、两个匹配总体,数据的检验,两个正态总体成对数据的差值仍服从正态分布,配对差是随机的,故,检验统计量为,二、两个总体比例之差的检验,1.,假定条件,两个,总体都服从二项分布,可以用正态分布来近似,2.,检验统计量,检验,H,0,:,1,-,2,=0,检验,H,0,:,1,-,2,=,d,0,【,例,3】,有两种方法生产同一种产品,方法,1,的生产成本较高而次品率较低,方法,2,的生产成本较低而次品率则较高。管理人员在选择生产方法时,决定对两种方法的次品率进行比较,如方法,1,比方法,2,的次品率低,8%,以上,则决定采用方法,1,,否则就采用方法,2,。管理人员从方法,1,生产的产品中随机抽取,300,个,发现有,33,个次品,从方法,2,生产的产品中也随机抽取,300,个,发现有,84,个次品。用显著性水平,=0.01,进行检验,说明管理人员应决定采用哪种方法进行生产?,H,0,:,1,-,2,8%,H,1,:,1,-,2,8%,=,0.01,n,1,=,300,n,2,=,300,临界值,(,c,):,检验统计量,:,决策,:,结论,:,拒绝,H,0,(,P,=1.22E-15,=0.05),方法,1,的次品率显著低于方法,2,达,8%,,应采用方法,1,进行生产,-2.33,Z,0,拒绝域,三、两个总体方差之比的检验,假定条件,两个总体都服从正态分布,且方差相等,两个独立的随机样本,检验统计量,课堂练习,假日饭店有,500,间客房,正常时间每间客房的日租金为,100,美元,已知每天平均入住率服从正态分布,占全部客房的,70%,,其标准差为,78,间。,现在经理进行一项试验,采取优惠措施把房价降低,15%,,经过,36,天的观察,平均每天有,406,间客房被入住。,试以,0.05,的显著性水平估计优惠措施是否有明显的效果。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!