分布拟和检验法的基本原理与步骤课件(-39张)

上传人:痛*** 文档编号:245182306 上传时间:2024-10-07 格式:PPT 页数:38 大小:1.18MB
返回 下载 相关 举报
分布拟和检验法的基本原理与步骤课件(-39张)_第1页
第1页 / 共38页
分布拟和检验法的基本原理与步骤课件(-39张)_第2页
第2页 / 共38页
分布拟和检验法的基本原理与步骤课件(-39张)_第3页
第3页 / 共38页
点击查看更多>>
资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,分布拟和检验,引言,前面所介绍的各种检验法,,是在总体分布类,型已知的情况下,,对其中的未知参数进行检验统称,为,参数检验,.,在实际问题中,,有时我们并不能确切预,知总体服从何种分布,,这时就需要根据来自总体的,样本对总体分布进行推断,,以判断总体服从何种分,这类统计检验称为,非参数检验,.,布,解决这类问题的工具是英国统计学家K.皮尔逊在,1900年发表的一篇文章中引进的所谓,检验法,不少人把此项工作视为近代统计学的开端.,引例,从1500到1931年的432年间,每年爆发战争的,次数可以看作一个随机变量,椐统计,这432年间共,爆发了299次战争,具体数据如下:,根据所学知识和经验,每年爆发战争的次数,用一个泊松随机变量来近似描述,,即可以假设每年,可以,4,4,15,3,48,2,142,1,223,0,发生 次战争的年数,战争次数,一,结为,:,如何利用上述数据检验,服从泊松分布的假,设.,爆发战争次数的分布,近似泊松分布.,于是,问题归,又如,某工厂制造一批骰子,声称它是均匀的,即在,抛掷试验中,出现1点,2点,6点的概率都应是,为检验骰子是否均匀,要重复地进行抛掷骰子的试,验,并统计各点出现的频率与,的,差距.,问题归结为,:,如何利用得到的统计数据对“骰子均,匀”的假设进行检验.,检验法的基本思想,检验法是在总体,的分布未知时,根据来自总,体的样本,检验关于总体分布的假设的一种检验,方法.,具体进行检验时,,先提出原假设:,总体,的分布函数为,如果总体分布为,离散型,,,则假设具体为,总体,的分布律为,如果总体分布为,连续型,,,则假设具体为,总体,的概率密度函数为,二、,然后根据样本的经验分布和所假设的理论分布之间,的吻合程度来决定是否接受原假设,这种检验通常,称作,拟合优度检验,,,它是一种,非参数检验,.,一般地,,我们总是根据样本观察值用直方图和经验,分布函数,,推断出可能服从的分布,,然后作检验.,检验法的基本原理和步骤,(1),总体,的分布函数为,(2),区间,,记为,如可取为,其中,可取,可取,区间的划分视具体,情况而定,,使每个小区间所含样本值个数不小于,5,,而区间个数,不要太大也不要太小.,提出原假设,的取值范围分成,个互不相交的小,将总体,(3),个小区间,的样本值的个数记作,把落入第,称为,组频数,,,所有组频数之和,三,等于,样本容量,(4),根据所假设的总体理论分布,算出总体,的值落入第,个小区间,的概率,于是,就是落入第,个小区间,的样本值的,理论,频数,.,(5),可,为真时,当,为真时,当,区间,的频率,与概率,应很接近,次试验中样本值落入第,个小,当,不真,时,与,相差较大.,引入统计量,皮尔逊证明了下列,定理:,定理,当,充分大,时,,近似服从,分布.,(6),对给定的显著性水平,根据定理,确定,值,使,查,分布表得,所以拒绝域为,(7),的实测值落入拒绝域,,则拒绝原假设,否则就认,为差异不显著而接受原假设,算得统计量,若由所给的样本值,例1,将一颗骰子掷120次,所得数据见下表,解,则16点中每点出,现的可能性相同,都为1/6.,如果用,表示第,点出现,则待检假设,在,成立的条件下,理论概率,问这颗骰子是否均匀、,对称,(取,若这颗骰子是均匀的、,对称的,由,得频率,计算结果如下表,.,查表得,因此分布不含未知参数,又,由上表,知,1,2,3,4,5,6,23,1/6,20,9/20,26,1/6,20,36/20,21,1/6,20,20,20,20,1/6,1/6,1/6,1/20,20,15,15,0,25/20,25/20,合计,120,4.8,由上表,知,1,2,3,4,5,6,23,1/6,20,9/20,26,1/6,20,36/20,21,1/6,20,20,20,20,1/6,1/6,1/6,1/20,20,15,15,0,25/20,25/20,合计,120,4.8,故接受,认为这颗骰子是均匀对称的,.,四、总体含未知参数的情形,在对总体分布的假设检验中,,分布函数的形式,但其中还含有未知参数,数为,其中,为未知参数.,设,自总体,的样本,现要用此样本函数来检验,假设:,总体,的分布函数为,有时只知道总体,的,即分布函,是取,此类情况可按如下步骤进行检验:,利用样本,求出,的最,(1),大似然估计,(2),则,就变成完全已知的分布函数,(3),中用,代替,在,时,计算,利用,计算,的估,计值,(4),计算要检验的统计量,当,充分大时,统计量,近似地服从,分布;,(5),得拒绝域,对给定的显著性水平,注,:,在使用皮尔逊,检验法时,要求,每个理论频数,否则应适当地合,并相邻的小区间,,使,满足要求.,以及,例2,参数为,的泊松分布,.,根据观察结果,得参数,的最大似然估计为,按参数为0.69的泊松分布,的估计是,根据引例所给数表,将有关计算结果列表如下,:,检验引例中对战争次数,提出的假设,服从,计算事件,的概率,战争次数,实测频数,0,1,2,3,4,223,142,48,15,4,0.5016,0.3460,0.119,0.0278,0.05,216.7,149.5,51.6,12.0,2.16,0.183,0.376,0.251,1.654,例2,参数为,的泊松分布,.,根据引例所给数表,将有关计算结果列表如下,:,检验引例中对战争次数,提出的假设,服从,战争次数,实测频数,0,1,2,3,4,223,142,48,15,4,0.5016,0.3460,0.119,0.0278,0.05,216.7,149.5,51.6,12.0,2.16,0.183,0.376,0.251,1.654,将,的组予以合并,即将以生3次及4次战争的,组归并为一组,.,因,所假设的理论分布中有一个未,知参数,故自由度为,按,自由度为2 查,分布表得,因统计量,的观察值,未落入拒,绝域,.,的泊松分布,.,故认为每年发生战争的次数,服从参数为0.69,例3,投放了四种鱼,:,鲑鱼、鲈鱼、竹夹鱼和鲇鱼的鱼苗.,现在在鱼塘里获得一样本如下,:,试取,检验各类鱼的数量的比例较10前是否,有显著改变,.,解,按题意需检验假设,:,的分布律为,一农场院10年前在一鱼塘里按比例20:15:,40:25,序号,种类,1,2,3,4,鲑鱼,鲈鱼,竹夹鱼,鲇鱼,数量(条),132,100,200,168,以,记鱼种类的序号,1,2,3,4,0.20,0.15,0.40,0.25,按题意需检验假设,:,的分布律为,以,记鱼种类的序号,1,2,3,4,0.20,0.15,0.40,0.25,所需计算列在下表中,.,现在,但,故拒绝,数量之比较10年前有显著改变.,认为各鱼类,完,例4,在一实验中,每隔一定时间观察一次由某种铀,共观察了100次,得结果如下表所示,:,其中,是观察到有,个,粒子的次数,.,从理论上考虑,所放射的到计数器上的,粒子数,应服从泊松分布,知,试在水平0.05下检验假设,总体,服从泊松分布:,解,给出,估计,由最,大似然估计法,在,假设下,松分布的假设,能取的值为,所有可,参数,未具体,所以先,因在,中,得,即在,服从泊,下,将其分成如表所示的两两不相交的子集,解,将其分成如,表所示的两两,不相交的子集,则,有,估计,计算结果如表,所示,其中有些,的组予以适当合并,使得每组均有,1,5,16,17,26,11,9,9,2,1,2,1,0,0.015,0.063,0.132,0.185,0.194,0.163,0.114,0.069,0.036,0.017,0.007,0.003,0.02,1.5,6.3,13.2,18.5,19.4,16.3,11.4,6.9,3.6,1.7,0.7,0.3,0.2,解,计算结果如表,所示,其中有些,的组予以,组均有,1,5,16,17,26,11,9,9,2,1,2,1,0,0.015,0.063,0.132,0.185,0.194,0.163,0.114,0.069,0.036,0.017,0.007,0.003,0.02,1.5,6.3,13.2,18.5,19.4,16.3,11.4,6.9,3.6,1.7,0.7,0.3,0.2,4.615,19.394,15.622,34.845,7.423,7.105,11.739,5.538,适当合并,使得每,如表中第四列花,括号所示.,此处,并组后,因在计算概率时,估计了一个参数,故,的自由度为,但,查表得,现在,故在水平0.05下接受,即认为样本来自泊松布总体.,例5,分布,从一批棉纱中随机抽取300条进行拉力试验,果列在下表中,我们的问题是检验假设,解,可按以下四步来检验,:,(1),分成13组,:,将观测值,为检验棉纱的拉力强度(单位,:,公斤),服从正态,结,但是这样分组后,前两组和最后两组的,比较小,故,(2),这里,就是正态,计算每个区间上的理论频数,.,把它们合并成为一个组(见分组数据表),棉纱拉力数据的分组表,解,可按以下四步来检验,:,(1),分成组,将观测值,(2),这里,就是正态,计算每个区间上的理论频数,.,分别用它们的最大似然估计,分布,的分布函数,含有两个未知数,和,来代替,.,关于,的计算作如下说明,:,因拉力数据表中,的每个区间都很狭窄,然后将每个区间的中点值乘以该,取这个区间的中点,区间的样本数,将这些值相加再除以总样本数就得,我们可认为每个区间内,都,和,具体样本均值,计算得到,:,解,(2),计算每个区间上的理论频数,.,分别用它们的最大似然估计,两个未知数,和,来代替,.,计算它在上面,对于服从,的随机变量,个区间上的概率,第,(3),如分组表中所列,.,中落在每个区间的实际频数,计算,(4),计算统计量值:,因为,故,的自由度为,解,(4),计算统计量值:,因为,故,的自由度为,查表得,故拒绝原假设,即认为棉纱拉力强度不服从正态分布,.,内容小结,在实际问题中,有时我们并不能确切预知总体服从,何种分布,这时就需要根据来自总体的样本对总体,的分布进行推断,以判断总体服从何种分布,这类统,计检验称为,非参数检验,.,本节介绍了一类非参数检,验方法:,检验法,检验法的基本思想,检验法的基本原理和步骤,检验法总体含未知参数的情形,检验法是在总体,的分布未知时,根据来自总,体的样本检验关于总体分布的假设的一种试验方,法.,具体进行检验时,先提出原假设:,总体,的分布函数为,如果总体分布为,离散型,则假设具体为,总体,的分布律为,如果总体分布为,连续型,则假设具体为,总体,的概率密度函数为,检验法的基本思想,检验法的基本思想,然后根据样本的经验分布和所假设的理论分布之间,的吻合程度来决定是否接受原假设,这种检验通常,称为,拟合优度检验,.,它是一种,非参数检验,.,一般地,我们总是根据样本观察值用直方图和经验,分布函数,推断出总体可能服从的分布,然后作检验.,1.,将总体,的取值范围分成,个互不重迭的小区,间,记为,2.,把落入第,个小区间,的样本值的个数记作,称为,实测频数,所有实测频数之和,等于样本容量,3.,根据所假设的理论分布,可算出总体,的值落,入每个,的概率,于是,就是落入,的样本,值的,理论频数,.,4.,引进检验统计量,则当,充,检验法的基本原理和步骤,检验法的基本原理和步骤,分大,时,布.,对给定的显著性水平,确定,值,使,查,分布表得,所以拒绝域为,若由所给的样本值,算得统计量的实测值,落入拒绝域,则拒绝
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!