[精选]分布拟合检验(PPT 24)10854

上传人:无*** 文档编号:244031380 上传时间:2024-10-02 格式:PPTX 页数:25 大小:252.94KB
返回 下载 相关 举报
[精选]分布拟合检验(PPT 24)10854_第1页
第1页 / 共25页
[精选]分布拟合检验(PPT 24)10854_第2页
第2页 / 共25页
[精选]分布拟合检验(PPT 24)10854_第3页
第3页 / 共25页
点击查看更多>>
资源描述
单击以编辑母版标题样式,单击以编辑母版文本样式,第二级,第三级,第四级,第五级,*,分布拟合检验,在实际问题中,有时不能预知总体服从什么类型的,分布,则需要根据样本来检验关于分布假设.本讲我们学习,c,2,检验法,和,“,偏度、峰度检验法,”,。,(一),c,2,检验法,在总体分布为未知时,根据样本x,1,x,2,x,n,来检验关,于总体分布假设,H,0,:总体x的分布函数为F(x),(1),H,1,:总体x的分布函数不是F(x),若总体x为离散型,则假设(1)相当于,H,0,:总体x的分布律为Px=t,i,=p,i,i=1,2,(2),若总体x为连续型,则假设(1)相当于,H,0,:总体x的概率密度为f(x).(3),在用,c,2,检验法检验假设H,0,时,若在假设H,0,下F(x)的形式,已知,但其参数值未知,这时需要先用极大似然估计法估计,参数,然后再作检验.,c,2,检验法的思想:将随机试验可能结果的全体,分为,k个互不相容的事件A,1,A,2,A,k,(,A,i,=,A,i,A,j,=.,ij,i,j=1,2,k).,于是在假设H,0,下,我们可以计算p,i,=P(A,i,),i=1,2,k.在n次试验中,事件A,i,出现的频率 f,i,/n,与p,i,往往有差异,但一般来说,若H,0,为真,且试验的次数又较多时,则这种差,异不应很大.基于这种想法,皮尔逊使用,(4),作为检验假设的统计量,并证明了以下定理,定理,若n充分大(n,50),则当H,0,为真时(不论H,0,中的,分布属什么分布),统计量,总是近似地服从自由度为k-r-1的,2,分布。其中r是被估计,参数的个数。,于是,在假设H,0,下计算(4),有.,2,a,2,(k-r-1),,则在显著性水平,a,下拒绝,H,0,,否则接受,H,0,。,使用时必须注意n要足够大,以及np,i,不太小。n不小,于50,以及每个np,i,都不小于5,而且np,i,最好在5以上,否则,应适当地合并A,i,,以满足这个要求。,例1 在一实验中,,每隔一定时间观察一次由某种铀,所放射的到达计数器上的a粒子数,共观察了100次,得结,果如下表所示:,其中f,i,是观察到有i,个a粒子的个数,。从理论上考虑x,应服从,泊松分布,i 0 1 2 3 4 5 6 7 8 9 10 11 12,f,i,1 5 16 17 26 11 9 9 2 1 2 1 0,A,i,A,0,A,1,A,2,A,3,A,4,A,5,A,6,A,7,A,8,A,9,A,10,A,11,A,12,问(6)式是否符合实际(,a,=0.05)?即在水平0.05下检验假设,H,0,:,总体服从泊松分布,解 因在H,0,中参数,l,未具体给出,所以先估计,l,.由极,大似然估计法得 .可将试验可能结果的全体分,为两两不相容的事件A,0,A,1,A,11,A,12,则Px=i,有估计,(6),例如,例1 的,2,检验计算表,A,0,1 0.015 1.5 -1.8 0.415,A,1,5 0.063 6.3,A,2,16 0.132 13.2 2.8 0.594,A,6,9 0.114 11.4 -2.4 0.505,A,7,9 0.069 6.9 2.1 0.639,A,8,2 0.036 3.6,-0.5 0.0385,A,12,0 0.002 0.2,6.2185,平0.05下接受H,0,。即认为样本来自泊松分布总体。也就,是说认为理论上的结论是符合实际的。,例2 自1995年1月1日至1971年2月9日共2231天中,,全世界记录到里氏震级4级和4级以上地震计162次,统计,如下,0-4 5-9 10-14 15-19 20-24 25-29 30-34 35-39 40,50 31 26 17 10 8 6 6 8,相继两次地震相隔天数x,出现的天数,试检验相继两次地震的天数x服从指数分布,(a=0.05).,解 需检验假设,H,0,:,x,的概率密度为,先由极大似然估计法求得,q,的估计为,x,为连续型随机变量,将0,)分为k=9个互不重叠的子区,间a,i,a,i+1,),i=1,2,9。如表所列,取A,i,=a,i,xa,i+1,i=1,2,9。若H,0,为真,x的分布函数的估计为,由上式可得概率p,i,=P(A,i,)的估计,结果列表如下,例2 的,2,检验计算表,A,1,:0 x4.5 50 0.2788 45.1656 -4.844 0.5176,A,2,:4.5x9.5 31 0.2196 35.5752 4.5752 0.5884,A,3,:9.5x14.5 26 0.1527 24.7374 -1.2626 0.0644,.,A,7,:2 9.5x34.5 6 0.0358 5.7996 -0.2004 0.0069,A,8,:34.5x39.5 6 0.0248 4.0176,A,9,:39.5x0.5633,故在水平0.05下接受H,0,,认为x服从指数分布。,例3 下面列出了84个伊特拉斯坎人男子的头颅的最大,宽度(mm),试检验这些数据是否来自正态总体(取,a,=0.1).,141 148 132 138 154 142 150 146 155 158,150 140 147 148 144 150 149 145 149 158,142 149 142 137 134 144 146 147 140 142,140 137 152 145,解,先作直方图:,1.把样本值x,1,x,2,x,n,进行分组。,找出最小值,最大值分别为126,158。,取a,b,得124.5,159.5,并7等分区间,小区间长,度=(b-a)/m=5,称为组距,小区间端点称为组限。,用唱票方法,数出样本值落在每个区间(t,i,t,i+1,),中的,频数,记为f,i,。,2.计算 r,i,=f,i,/n,(n=84,I=1,2,7).详见下页表。由,于n,个样本独立,则r,i,近似于样本落入区间(t,i,t,i+1,)的概率。,即,r,i,Pt,i,x,i,t,i+1,i=0,1,2,m.,问题是如何去估计f(x).,组限 频数f,i,频率 f,i,/n 积累频率,124.5129.5 1 0.0119 0.0119,129.5134.5 4 0.0476 0.0595,134.5139.5 10 0.1191 0.1786,139.5144.5 33 0.3929 0.5715,144.5149.5 24 0.2857 0.8572,149.5154.5 9 0.1071 0.9524,154.5159.5 3 0.0357 1,3.在xoy平面上,从左自右依次做以(f,i,/n)/,为高的小,矩形,即得直方图。,易见,这种小矩形的面积等于数据落在该小区间的频率f,i,/n.,因频率近似于概率,因而一般来说每一个小区间上的小矩形面积接近于概率密度曲线之下该小区间上的曲边梯形的面积,故直方图的外廓曲线接近于总体x的概率密度曲线f(x).从本例看,单峰对称,近似正态总体。,作c,2,检验如下,,检验假设:,H,0,:x的概率密度为,按上式查标准分布表可得p(A,i,)的估计.如,例3的,2,检验计算表,A,1,:x129.5 1 0.0087 0.73,A,2,:129.5x134.5 4 0.0519 4.36,A,3,:134.5x139.5 10 0.1752 14.72 -4.72 1.51,A,4,:139.5x144.5 33 0.3120 26.21 6.79 1.76,A,5,:145.5x149.5 24 0.2811 23.61 0.39 0.01,A,6,:149.5x154.5 9 0.1336 11.22,A,7,:154.5x 3 0.0375 3.15,3.67,故在水平0.1下接受H,0,即认为数据来自正态分布总体.,二 偏度、峰度检验,随机变量的偏度、峰度指的是x的标准化变量,的 三阶中心矩和四阶中心矩,当随机变量x服从正态分布时,v,1,=0 且 v,2,=3.,设x,1,x,2,x,n,是来自总体x的样本,则v,1,v,2,的 矩估计分别为,其中B,k,(k=2,3,4),是样本k阶中心矩,分别称g,1,g,2,为样本偏,度和样本峰度。,若总体x,为正态变量,则可证当n充分大时,近似地有,设x,1,x,2,x,n,是来自总体x的样本,现在来检验假设,H,0,:,x为正态总体.,当H,0,为真且n充分大时,近似地有,u,1,N(0,1),u,2,N(0,1).,由第六章,知样本偏度g,1,、g,2,分别依概率收敛于总体偏度v,1,和总体峰度v,2,.,因此当H,0,为真且n充分大时,一般来说,g,1,与,v,1,=0的偏度不应太大,而g,2,与v,2,=3的偏离不应太大.故从,直观来看当|u,1,|,或|u,2,|,过大时就拒绝H,0,.取显著水平为,a,H,0,的拒绝域为,|u,1,|k,1,或|u,2,|k,2,其中k,1,k,2,由下式确定.,即有 k,1,=Z,a/4,,k,2,=Z,a/4,.,于是拒绝域为,|u,1,|Z,a/4,或|u,2,|Z,a/4,下面验证当n充分大时,,上述检验近似满足显著性,水平a的要求,。,事实上,n充分大时有,例4 试用偏度、峰度检验法检验例3中的数据是,否来自正态总体(取,a,=0.1).,解,检验假设,H,0,:,数据来自正态总体.,=0.1,n=84,2,=3-6/(n+1)=2.27294,样本偏度和峰度为,g,1,=-0.1363,g,2,=3.0948.,而z,a/4,=z,0.025,=1.96.则拒绝域为,|u,1,|=|g,1,/,s,1,|1.96 或|u,2,|=|g,2,-m,2,|,/s,2,1.96.,计算得|u,1,|=0.52851.96,|u,2,|=0.33811.96,故接受H,0,,认为数据来自正态分布总体。,9,、静夜四无邻,荒居旧业贫。,10月-24,10月-24,Wednesday,October 2,2024,10,、雨中黄叶树,灯下白头人。,05:59:24,05:59:24,05:59,10/2/2024 5:59:24 AM,11,、以我独沈久,愧君相见频。,10月-24,05:59:24,05:59,Oct-24,02-Oct-24,12,、故人江海别,几度隔山川。,05:59:24,05:59:24,05:59,Wednesday,October 2,2024,13,、乍见翻疑梦,相悲各问年。,10月-24,10月-24,05:59:24,05:59:24,October 2,2024,14,、他乡生白发,旧国见青山。,02 十月 2024,5:59:24 上午,05:59:24,10月-24,15,、比不了得就不比,得不到的就不要。,。,十月 24,5:59 上午,10月-24,05:59,October 2,2024,16,、行动出成果,工作出财富。,2024/10/2 5:59:24,05:59:24,02 October 2024,17,、做前,能够环视四周;做时,你只能或者最好沿着以脚为起点的射线向前。,5:59:24 上午,5:59 上午,05:59:24,10月-24,9,、没有失败,只有暂时停止成功!。,10月-24,10月-24,Wednesday,October 2,2024,10,、很多事情努力了未必有结果,但是不努力却什么改变也没有。,05:59:24,05:59:24,05:59,10/2/2024 5:59:24 AM,11,、成功就是日复一日那一点点小小努力的积累。,10月-24,05:59:24,05:59,Oct-24,02-Oct-24,12,、世间成事,不求其绝对圆满,留一份不足,可得无限完美。,05:59:24,05:59:24,05:59,Wednesday,October 2,2024,13,、不知香积寺,数里入
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!