正态性检验方法说明介绍

上传人:ail****e1 文档编号:53732635 上传时间:2022-02-11 格式:DOCX 页数:26 大小:50.54KB
返回 下载 相关 举报
正态性检验方法说明介绍_第1页
第1页 / 共26页
正态性检验方法说明介绍_第2页
第2页 / 共26页
正态性检验方法说明介绍_第3页
第3页 / 共26页
点击查看更多>>
资源描述
正态性检验方法简介一、 Anderson-Darling 检验Anderson Darling检验(简称A-D检验)是一种拟合检验,此检验是将 样本数据的经验累积分布函数与假设数据呈正态分布时期望的分布进行比较,如果差异足够大,该检验将否定总体呈正态分布的原假设。样本数据的经验累积分布函数与理论累积分布函数之间的差异可通过两种分布之间的二次AD距离进行衡量,若二次AD距离小于置信水平下的临界值, 则可认为样本数据来源于正态分布。Anderson-Darling检验的计算步骤如下:1,提出假设:H 0 :样本数据服从正态分布;H 0 :样本数据不服从正态分布;2.计算统计量A2 ,其计算步骤为:? 首先将样本数据按照从小到大的顺序进行排序并编号,排在第i位的数据其次进行样本数据的标准化,计算公式如下:xi xYi-i S(式 1-1 )其中,x为所有样本数据的平均值,S为所有样本数据的标准差。?接着计算F(Yi),计算公式为F(Y)(Yi)(式 1-2 )其中,其中 为标准正态分布函数,可查表获得。最后A2值,计算公式如下:NA2N (2i1)lnF(Yi) ln 1F (Yn 1 i)N i 1(式 1-3 )其中,N为样本总个数,i为样本序号,23.计算判定统计量A ,计算公式为:A2A2(1 等2.252) N2(式 1-4)4 .查找临界化根据给定的显著性水平a,查Anderson-Darling临界值表,2得到临界值A ;,2,25 .作出判定:若AA ,则在a水平上,拒绝H0,即认为样本数据不服从正态分布;若A,2 A2,则不能拒绝Ho,即认为样本数据服从正态分布。例1.采用Anderson-Darling 判断表1中的数据是否符合正态分布表1 A-D检测样本数据1 丁 P数据1 丁 P数据1 丁 P数据18.141810.38359.6228.301910.38369.7238.442010.43379.7448.452110.48389.7858.622210.50399.9268.772310.56409.9478.822410.58419.9888.822510.69429.9998.902610.774310.02108.972710.804410.04119.012811.254510.06129.282911.444610.16139.343011.684710.22149.413111.844810.32159.443212.044910.36169.513312.125010.37179.543412.51检验步骤如下:1提出假设.H0 :样本数据服从正态分布.H0:样本数据不服从正态分布.2.计算统计量A2,其计算步骤为:? 首先将样本数据按照从小到大的顺序进行排序并编号,排在第i位的数据为Xi ,如表2中的第2列所小;? 按照式1-1进行样本数据的标准化,如:xi x 8.14 10.01Yi 1.0261.823 ,X2 X 8.30 10.01S 1.0261.667其余依次类推,计算结果如表2中的第3列所示? 按照式1-2计算F(Y),如:F(Y1)(Y1)( 1.823) 0.034, F(Y2)(Y2)( 1.667) 0.048其余依次类推,计算结果如表2中的第4列所示。计算 ln F(Yi)和垢1 F(Yi),如:lnF(Y,) ln( 0.034)3.376, ln1 F (Y1) ln(1 0.034)0.035其余依次类推,计算结果如表2中的第5列和第6列所示。计算 ln F(Yi) ln1 F(Yn i 1),如:当i=1时,ln F (Yi) ln1 F(YN i 1) ln F(Y1) ln1 F (Y50)3.376 ( 4.095)8.281当i =2时,In F (Yi) ln1 F(Yn i 1) In F (Y2) ln1F(Y49)3.041 ( 3.919)6.960其余依次类推,计算结果如表2中的第7列所示。? 计算(2i 1) In F (Yi) ln1 F(Yn i 1),如:当i =1时,(2i 1)ln F(Y) ln1 F(Yn i 1)lnF(Y1)ln1 F*。)8.281当i=2时,(2i 1)ln F(Yi) ln1 F(YN i 1) 3ln F(Y2) ln1 F(Y49) 3 ( 6.960)20.879其余依次类推,计算结果如表2中的第8列所示。? 最后计算A2 :502 1A250 (2i 1) lnF(Yi) ln 1 F(Yn 1 i)50 i 1150 8.281 ( 20.879)( 4.180)150 ( 2519.612)500.392表2 A-D检测计算过程表J 丁 pi数据Xi标准化YiF(Yi)lnF(Yi)ln1 F(Y)lnF(Yi) ln1 F(Yn)(2i 1)ln F(Y) ln1 F(Yn)18.14-1.8230.034-3.376-0.035-8.281-8.28128.30-1.6670.048-3.041-0.049-6.960-20.87938.44-1.5300.063-2.765-0.065-6.497-32.4871 丁 pi数据Xi标准化YiF(Yi)lnF(Yi)ln1 F(Y)lnF(Yi) ln1 F(Yn)(2i 1)ln F(Y) ln1 F(Yn)48.45-1.5200.064-2.746-0.066-6.036-42.25358.62-1.3550.088-2.433-0.092-5.394-48.54468.77-1.2090.113-2.177-0.120-4.681-51.49678.82-1.1600.123-2.095-0.131-4.272-55.53488.82-1.1600.123-2.095-0.131-3.606-54.09498.90-1.0820.140-1.969-0.150-3.441-58.493108.97-1.0140.155-1.862-0.169-3.233-61.434119.01-0.9750.165-1.803-0.180-3.043-63.904129.28-0.7120.238-1.434-0.272-2.651-60.982139.34-0.6530.257-1.359-0.297-2.510-62.742149.41-0.5850.279-1.275-0.328-2.404-64.909159.44-0.5560.289-1.240-0.341-2.316-67.161169.51-0.4870.313-1.162-0.375-2.185-67.748179.54-0.4580.323-1.129-0.391-2.153-71.037189.62-0.3800.352-1.044-0.434-2.058-72.034199.72-0.2830.389-0.945-0.492-1.949-72.100209.74-0.2630.396-0.926-0.505-1.890-73.712219.78-0.2240.411-0.888-0.530-1.758-72.098229.92-0.0880.465-0.766-0.626-1.582-68.040239.94-0.0680.473-0.749-0.640-1.482-66.6841 丁 pi数据Xi标准化YiF(Yi)lnF(Yi)ln1 F(Y)lnF(Yi) ln1 F(Yn)(2i 1)ln F(Y) ln1 F(Yn)249.98-0.0290.488-0.717-0.670-1.434-67.375259.99-0.0190.492-0.709-0.678-1.410-69.0792610.020.0100.504-0.685-0.701-1.363-69.5192710.040.0290.512-0.670-0.717-1.340-71.0292810.060.0490.519-0.655-0.733-1.295-71.2362910.160.1460.558-0.583-0.817-1.209-68.9003010.220.2050.581-0.543-0.870-1.073-63.2903110.320.3020.619-0.480-0.964-0.985-60.0623210.360.3410.633-0.456-1.004-0.949-59.7683310.370.3510.637-0.451-1.014-0.884-57.4923410.380.3610.641-0.445-1.024-0.836-55.9963510.380.3610.641-0.445-1.024-0.820-56.6123610.430.4090.659-0.417-1.075-0.759-53.8673710.480.4580.677-0.391-1.129-0.718-52.4383810.500.4780.684-0.380-1.151-0.677-50.8033910.560.5360.704-0.351-1.218-0.623-47.9894010.580.5560.711-0.341-1.240-0.522-41.2074110.690.6630.746-0.293-1.371-0.462-37.3854210.770.7410.771-0.261-1.472-0.411-34.1164310.800.7700.779-0.249-1.511-0.381-32.3521 丁 Pi数据Xi标准化YiF(Yi)lnF(Yi)ln1 F(Y)lnF(Yi) ln1 F(Yn)(2i 1)ln F(Y) ln1 F(Yn)4411.251.2090.887-0.120-2.177-0.252-21.8974511.441.3940.918-0.085-2.505-0.206-18.2984611.681.6280.948-0.053-2.960-0.145-13.1974711.841.7840.963-0.038-3.290-0.104-9.7004812.041.9790.976-0.024-3.733-0.089-8.4814912.122.0570.980-0.020-3.919-0.069-6.6965012.512.4370.993-0.007-4.905-0.042-4.180,23 .计算判定统计量A,220,752.250.752.25AA2(1)0.392 (1:)0.398NN2505024 .查找临界值:根据给定的显著性水平a =0.05 ,查附件中、2Anderson-Darling临界值表彳马至U临界值A 0.752 ;2,25.作出判定:因为A A ,则不能拒绝H。,即认为样本数据服从正态分 布。二、 Ryan-Joiner 检验此检验通过计算数据与数据的正态分值之间的相关性来评估正态性。如果相关系数接近1,则总体就很有可能呈正态分布。Ryan-Joiner统计量可以评估 这种相关性的强度;如果它未达到适当的临界值,您将否定总体呈正态分布的原 假设。此检验类似于 Shapiro-Wilk 正态性检验。Ryan-Joiner检验的步骤为:1提出假设.H。:样本数据服从正态分布.H。:样本数据不服从正态分布.2.计算相关系数Rp,其计算步骤为:? 首先将样本数据按照从小到大的顺序进行排序,排在第 i位的数据为Xi ;其次进行样本数据的标准化,计算公式如下:xi Xb-S(式 2-1 )其中,X为所有样本数据的平均值,S为所有样本数据的标准差。然后Rp值,计算公式如下:RpNX bi i 1NS2(N 1)bi2i 1(式 2-2 )其中,N为样本总个数,i为样本序号3 .查找临界值:根据给定的显著性水平 a ,查Ryan-Joiner检测临界值表, 得至IJ临界值Rp(n,);4 .作出判定:若RpRp(n,),则在a水平上,不能拒绝H。,即认为样本数据 服从正态分布;若RpD(n,),则在a水平上,拒绝H。,即认为样本数据不服从正态分布;若DmaxD(n,),则不能拒绝H。,即认为样本数据服从正态分布。例2: 35位健康男性在未进食前的血糖浓度如表所示,试测验这组数据是否来 自正态分布:87, 77, 92, 68, 80, 78, 84, 77, 81,80, 80, 77, 92 ,86 ,76 ,80 ,81 ,75 ,77, 72 ,81,72, 84 ,86, 80 ,68 ,77, 87, 76, 77, 78, 92, 75, 80, 78解:检验过程如下:1 .首先计算样本均值和标准差,经计算样本均值以=79.7429 ,标准差(7=5.93763 ,故做出如下假设:H0 :健康成人男性血糖浓度服均值为79.7429 ,标准差为5.93763的正态分布;H1:健康成人男性血糖浓度不服均值为79.7429,标准差为5.93763的正态分布;2 .计算检验统计量D值表5 K-S检验中D统计量计算表血糖浓度次数累计次数(F)经验分布函数Fn (x) =F/n标准化值Z= (x u ) /s理论分布函数F0 (x) = 6 (Z)Di=| F0 (x) - Fn (x) |68220.0571-1.980.02400.033272240.1143-1.300.09610.018275260.1714-0.800.21220.040876280.2286-0.630.26420.0357776140.4000-0.460.32210.0779783170.4857-0.290.38460.1012806230.65710.040.51730.1399813260.74290.210.58380.1590842280.80000.720.76330.0367862300.85711.050.85400.0031872320.91431.220.88920.0251923351.00002.060.98050.0195? 首先将样本数据按照从小到大的顺序进行排列,并计算每个样本数据出现的次数f和累计次数F ,如表5中的第1、2、3列所示;?其次计算样本数据的经验分布函数(X),计算公式为:Fn(x):。其中F为样本数据的累计次数,n为样本总数,如:2Fn (68) 一 0.057135Fn(72)康0143,其余依次类推,计算结果如表5中的第4列所示;?然后进行样本数据的标准化,标准化计算公式为:Z(x)X X苴中S ,x为所有样本数据的平均值,S为所有样本数据的标准差,如:Z(68) 与68 79.74295.937631.98Z(72) 72s72 79.74295.937631.30其余依次类推,计算结果如表 5中的第5列所示;? 接着计算样本数据的理论分布函数F0(x),计算公式为:Fo(x)(Z),其中(Z)为标准正态分布函数,可通 过查找正态分布表获得,如:Fo (68)Z(68)( 1.98) 0.0228,Fo(72)Z(72)( 1.30) 0.0912,其余依次类推,计算结果如表 5中的第6列所示;? 计算K-S的D统计量,计算公式为:Di F(Xi) Fn(xJ ,例如:DiF0(Xi) Fn(X1) |F0(68) Fn(68)0.0332,D2 匠)七人)|F0(72) Fn(72)0.0182,依次类推,计算结果如表5中的第7列所示。? 最后找出统计量Dmax max(Di) 0.15903 .查找临界值:根据给定的显著性水平a和样本数据个数n,查单样本K-S检验临界值表可以得到临界值D(n,)。取 0.05,当n=35时,D 0.224,4 .做出判定:由于Dmax= 0.1590 16S 181- 21D|.2S2,.100.05C 025-010 CQ6.100.050. 025-010.COS单喇检舱的右M概用如果NA4。,则按卜F的计尊海钏近假的颊率r 200IDO双储的脸的方尾概率.050. 020.OiO九 22/*/a71- 36J-777L, 52/v7L 63* ioa“ 05O* 025*010单恻检Ifc的右尾展率 * .OUS
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 演讲稿件


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!