正态性检验 方法简介

上传人:小**** 文档编号:88687197 上传时间:2022-05-11 格式:DOC 页数:16 大小:1.29MB
返回 下载 相关 举报
正态性检验 方法简介_第1页
第1页 / 共16页
正态性检验 方法简介_第2页
第2页 / 共16页
正态性检验 方法简介_第3页
第3页 / 共16页
点击查看更多>>
资源描述
正态性检验方法简介一、 Anderson-Darling 检验AndersonDarling检验(简称A-D检验)是一种拟合检验,此检验是将样本数据的经验累积分布函数与假设数据呈正态分布时期望的分布进行比较,如果差异足够大,该检验将否定总体呈正态分布的原假设。样本数据的经验累积分布函数与理论累积分布函数之间的差异可通过两种分布之间的二次AD距离进行衡量,若二次AD距离小于置信水平下的临界值,则可认为样本数据来源于正态分布。Anderson-Darling 检验的计算步骤如下:1. 提出假设:; ;2. 计算统计量,其计算步骤为: 首先将样本数据按照从小到大的顺序进行排序并编号,排在第位的数据为; 其次进行样本数据的标准化,计算公式如下: (式1-1)其中,为所有样本数据的平均值,为所有样本数据的标准差。 接着计算,计算公式为 (式1-2)其中,其中为标准正态分布函数,可查表获得。 最后A2值,计算公式如下: (式1-3)其中,N为样本总个数,为样本序号 3. 计算判定统计量,计算公式为: (式1-4)4. 查找临界值:根据给定的显著性水平,查Anderson-Darling临界值表,得到临界值;5. 作出判定:若,则在水平上,拒绝,即认为样本数据不服从正态分布;若,则不能拒绝,即认为样本数据服从正态分布。例1. 采用Anderson-Darling判断表1中的数据是否符合正态分布。表1 A-D检测样本数据序号数据序号数据序号数据18.14 1810.38 35 9.62 28.30 1910.38 36 9.72 38.44 2010.43 37 9.74 48.45 2110.48 38 9.78 58.62 2210.50 39 9.92 68.77 2310.56 40 9.94 78.82 2410.58 41 9.98 88.82 2510.69 42 9.99 98.90 2610.77 43 10.02 108.97 2710.80 44 10.04 119.01 2811.25 45 10.06 129.28 2911.44 46 10.16 139.34 3011.68 47 10.22 149.41 3111.84 48 10.32 159.44 3212.04 49 10.36 169.51 3312.12 50 10.37 179.54 3412.51 检验步骤如下:1. 提出假设:;2. 计算统计量,其计算步骤为: 首先将样本数据按照从小到大的顺序进行排序并编号,排在第位的数据为,如表2中的第2列所示; 按照式1-1进行样本数据的标准化,如: , 其余依次类推,计算结果如表2中的第3列所示。 按照式1-2计算,如:,其余依次类推,计算结果如表2中的第4列所示。 计算和,如:,其余依次类推,计算结果如表2中的第5列和第6列所示。 计算,如:当=1时,当=2时,其余依次类推,计算结果如表2中的第7列所示。 计算,如:当=1时,当=2时,其余依次类推,计算结果如表2中的第8列所示。 最后计算:表2 A-D检测计算过程表序号数据标准化18.14-1.8230.034-3.376-0.035-8.281-8.28128.30-1.6670.048-3.041-0.049-6.960-20.87938.44-1.5300.063-2.765-0.065-6.497-32.48748.45-1.5200.064-2.746-0.066-6.036-42.25358.62-1.3550.088-2.433-0.092-5.394-48.54468.77-1.2090.113-2.177-0.120-4.681-51.49678.82-1.1600.123-2.095-0.131-4.272-55.53488.82-1.1600.123-2.095-0.131-3.606-54.09498.90-1.0820.140-1.969-0.150-3.441-58.493108.97-1.0140.155-1.862-0.169-3.233-61.434119.01-0.9750.165-1.803-0.180-3.043-63.904129.28-0.7120.238-1.434-0.272-2.651-60.982139.34-0.6530.257-1.359-0.297-2.510-62.742149.41-0.5850.279-1.275-0.328-2.404-64.909159.44-0.5560.289-1.240-0.341-2.316-67.161169.51-0.4870.313-1.162-0.375-2.185-67.748179.54-0.4580.323-1.129-0.391-2.153-71.037189.62-0.3800.352-1.044-0.434-2.058-72.034199.72-0.2830.389-0.945-0.492-1.949-72.100209.74-0.2630.396-0.926-0.505-1.890-73.712219.78-0.2240.411-0.888-0.530-1.758-72.098229.92-0.0880.465-0.766-0.626-1.582-68.040239.94-0.0680.473-0.749-0.640-1.482-66.684249.98-0.0290.488-0.717-0.670-1.434-67.375259.99-0.0190.492-0.709-0.678-1.410-69.0792610.020.0100.504-0.685-0.701-1.363-69.5192710.040.0290.512-0.670-0.717-1.340-71.0292810.060.0490.519-0.655-0.733-1.295-71.2362910.160.1460.558-0.583-0.817-1.209-68.9003010.220.2050.581-0.543-0.870-1.073-63.2903110.320.3020.619-0.480-0.964-0.985-60.0623210.360.3410.633-0.456-1.004-0.949-59.7683310.370.3510.637-0.451-1.014-0.884-57.4923410.380.3610.641-0.445-1.024-0.836-55.9963510.380.3610.641-0.445-1.024-0.820-56.6123610.430.4090.659-0.417-1.075-0.759-53.8673710.480.4580.677-0.391-1.129-0.718-52.4383810.500.4780.684-0.380-1.151-0.677-50.8033910.560.5360.704-0.351-1.218-0.623-47.9894010.580.5560.711-0.341-1.240-0.522-41.2074110.690.6630.746-0.293-1.371-0.462-37.3854210.770.7410.771-0.261-1.472-0.411-34.1164310.800.7700.779-0.249-1.511-0.381-32.3524411.251.2090.887-0.120-2.177-0.252-21.8974511.441.3940.918-0.085-2.505-0.206-18.2984611.681.6280.948-0.053-2.960-0.145-13.1974711.841.7840.963-0.038-3.290-0.104-9.7004812.041.9790.976-0.024-3.733-0.089-8.4814912.122.0570.980-0.020-3.919-0.069-6.6965012.512.4370.993-0.007-4.905-0.042-4.1803. 计算判定统计量, 4. 查找临界值:根据给定的显著性水平=0.05,查附件中Anderson-Darling临界值表,得到临界值;5. 作出判定:因为,则不能拒绝,即认为样本数据服从正态分布。二、 Ryan-Joiner检验此检验通过计算数据与数据的正态分值之间的相关性来评估正态性。如果相关系数接近 1,则总体就很有可能呈正态分布。Ryan-Joiner 统计量可以评估这种相关性的强度;如果它未达到适当的临界值,您将否定总体呈正态分布的原假设。此检验类似于 Shapiro-Wilk 正态性检验。Ryan-Joiner检验的步骤为:1. 提出假设:;2. 计算相关系数,其计算步骤为: 首先将样本数据按照从小到大的顺序进行排序,排在第位的数据为; 其次进行样本数据的标准化,计算公式如下: (式2-1)其中,为所有样本数据的平均值,为所有样本数据的标准差。 然后值,计算公式如下: (式2-2)其中,N为样本总个数,为样本序号 3. 查找临界值:根据给定的显著性水平,查Ryan-Joiner检测临界值表,得到临界值;4. 作出判定:若,则在水平上,不能拒绝,即认为样本数据服从正态分布;若,则拒绝,即认为样本数据不服从正态分布。例2. 采用Ryan-Joiner方法判断表3中的数据是否符合正态分布。表3 Ryan-Joiner检测样本数据序号数据序号数据序号数据18.14 1810.38 35 9.62 28.30 1910.38 36 9.72 38.44 2010.43 37 9.74 48.45 2110.48 38 9.78 58.62 2210.50 39 9.92 68.77 2310.56 40 9.94 78.82 2410.58 41 9.98 88.82 2510.69 42 9.99 98.90 2610.77 43 10.02 108.97 2710.80 44 10.04 119.01 2811.25 45 10.06 129.28 2911.44 46 10.16 139.34 3011.68 47 10.22 149.41 3111.84 48 10.32 159.44 3212.04 49 10.36 169.51 3312.12 50 10.37 179.54 3412.51 检测过程如下:1. 提出假设:;2. 计算统计量,其计算步骤为: 首先将样本数据按照从小到大的顺序进行排序并编号,排在第位的数据为,如表4中的第2列所示; 按照式2-1进行样本数据的标准化,如: , 其余依次类推,计算结果如表2中的第3列所示。 计算,如:,其余依次类推,计算结果如表4中的第4列所示。 计算,如:,其余依次类推,计算结果如表4中的第5列所示。 计算,如:表4 RyanJoiner检测过程计算表序号18.14-1.823-14.8363.32228.30-1.667-13.8332.77838.44-1.530-12.9152.34248.45-1.520-12.8482.31258.62-1.355-11.6781.83568.77-1.209-10.5991.46178.82-1.160-10.2301.34588.82-1.160-10.2301.34598.90-1.082-9.6291.170108.97-1.014-9.0921.027119.01-0.975-8.7820.950129.28-0.712-6.6030.506139.34-0.653-6.0990.426149.41-0.585-5.5030.342159.44-0.556-5.2440.309169.51-0.487-4.6350.237179.54-0.458-4.3700.210189.62-0.380-3.6570.144199.72-0.283-2.7470.080209.74-0.263-2.5630.069219.78-0.224-2.1920.050229.92-0.088-0.8700.008239.94-0.068-0.6780.005249.98-0.029-0.2920.001259.99-0.019-0.1950.0002610.020.0100.0980.0002710.040.0290.2940.0012810.060.0490.4900.0022910.160.1461.4850.0213010.220.2052.0920.0423110.320.3023.1180.0913210.360.3413.5340.1163310.370.3513.6390.1233410.380.3613.7430.1303510.380.3613.7430.1303610.430.4094.2700.1683710.480.4584.8010.2103810.500.4785.0150.2283910.560.5365.6610.2874010.580.5565.8780.3094110.690.6637.0850.4394210.770.7417.9780.5494310.800.7708.3160.5934411.251.20913.5961.4614511.441.39415.9451.9434611.681.62819.0112.6494711.841.78421.1183.1814812.041.97923.8223.9154912.122.05724.9254.2295012.512.43730.4825.937合计49.81849.0315. 查找临界值:根据给定的显著性水平=0.05,查Ryan-Joiner检测临界值表,得到临界值;6. 作出判定:因为,则在水平上,不能拒绝,即认为样本数据服从正态分布。三、 K-S检验K-S(KolmogorovSmirnov)检验是以两位苏联数学家柯尔莫哥(Kolmogorov)和斯米诺夫(Smirnov)命名的。K-S检验是一种拟合优度检验,研究样本观察值的分布和设定的理论分布间是否吻合,通过对两个分布差异的分析确定是否有理由认为样本的观察结果来自所设定的理论分布总体。设是一个n次观察的随机样本观察值的累积概率分布函数,即经验分布函数;是一个特定的累积概率分布函数,即理论分布函数。定义,显然若对每一个x值来说,与十分接近,也就是差异很小,则表明经验分布函数与特定分布函数的拟合程度很高,有理由认为样本数据来自具有该理论分布的总体。K-S检验主要考察的是绝对差数中那个最大的偏差,即利用下面的统计量作出判断。 (式3-1)K-S检验的步骤为:1. 提出假设:,2. 计算各个D,找出统计量3. 查找临界值:根据给定的显著性水平和样本数据个数n,查单样本K-S检验临界值表可以得到临界值4. 作出判定:若,则在水平上,拒绝,即认为样本数据不服从正态分布;若,则不能拒绝,即认为样本数据服从正态分布。例2:35位健康男性在未进食前的血糖浓度如表所示,试测验这组数据是否来自正态分布:87, 77, 92, 68, 80, 78, 84, 77, 81, 80, 80, 77, 92 ,86 ,76 ,80 ,81 ,75 ,77, 72 ,81, 72, 84 ,86, 80 ,68 ,77, 87, 76, 77, 78, 92, 75, 80, 78 解:检验过程如下:1. 首先计算样本均值和标准差,经计算样本均值=79.7429,标准差=5.93763,故做出如下假设: H0:健康成人男性血糖浓度服均值为79.7429,标准差为5.93763的正态分布;H1: 健康成人男性血糖浓度不服均值为79.7429,标准差为5.93763的正态分布;2. 计算检验统计量D值表5 K-S检验中D统计量计算表血糖浓度次数(f)累计次数(F)经验分布函数Fn(x)=F/n标准化值Z=(xu)/s理论分布函数F0(x)=(Z)Di=| F0(x)- Fn(x)|68220.0571 -1.98 0.0240 0.0332 72240.1143 -1.30 0.0961 0.0182 75260.1714 -0.80 0.2122 0.0408 76280.2286 -0.63 0.2642 0.0357 776140.4000 -0.46 0.3221 0.0779 783170.4857 -0.29 0.3846 0.1012 806230.6571 0.04 0.5173 0.1399 813260.7429 0.21 0.5838 0.1590 842280.8000 0.72 0.7633 0.0367 862300.8571 1.05 0.8540 0.0031 872320.9143 1.22 0.8892 0.0251 923351.0000 2.06 0.9805 0.0195 首先将样本数据按照从小到大的顺序进行排列,并计算每个样本数据出现的次数和累计次数,如表5中的第1、2、3列所示; 其次计算样本数据的经验分布函数,计算公式为:。其中为样本数据的累计次数,为样本总数,如:,其余依次类推,计算结果如表5中的第4列所示; 然后进行样本数据的标准化,标准化计算公式为:,其中为所有样本数据的平均值,为所有样本数据的标准差,如: ,其余依次类推,计算结果如表5中的第5列所示; 接着计算样本数据的理论分布函数,计算公式为:,其中为标准正态分布函数,可通 过查找正态分布表获得,如:,其余依次类推,计算结果如表5中的第6列所示; 计算K-S的D统计量,计算公式为:,例如:依次类推,计算结果如表5中的第7列所示。 最后找出统计量3. 查找临界值:根据给定的显著性水平和样本数据个数n,查单样本K-S检验临界值表可以得到临界值。取当n=35时,4. 做出判定:由于= 0.1590,所以,不能拒绝,即测试数据服从正态分布。四、 关于Johnson转换中Z值选取的说明在Johnson转换中,需要根据正态性检验的结果进行Z值的选取,根据所选取的正态性检验方法的不同,Z值的选取方法也有所不同:(1)Anderson-Darling 检验若选用Anderson-Darling 检验,则应计算转换后数据的A2值和相应的值,从中选取最小的A2 值,如果该A2 值所对应的小于值,则相应的Z值即为最优的Z值,且所对应的转换形式就是最优的 Johnson 转换形式。若无法找到这样的z值,则说明样本数据不适合进行Johnson变换。(2)Ryan-Joiner检验若选用Ryan-Joiner检验,则应计算转换后数据的值,从中选取最大的 值,如果该值大于临界值,则相应的Z值即为最优的Z值,且所对应的转换形式就是最优的 Johnson 转换形式。若无法找到这样的z值,则说明样本数据不适合进行Johnson变换。(3)K-S检验检验若选用K-S检验,则应计算转换后数据的值,从中选取最小的 值,如果该小于临界值,则相应的Z值即为最优的Z值,且所对应的转换形式就是最优的 Johnson 转换形式。若无法找到这样的z值,则说明样本数据不适合进行Johnson变换。附表一:Anderson-Darling临界值表0.10.050.0250.010.0050.6310.7520.8731.0351.159附表二:Ryan-Joiner检验临界值表样本数50.90260.87930.82660.91060.88860.837970.91770.89740.849780.9240.90520.860590.92940.9120.8701100.9340.91790.8786110.93810.9230.8861120.94170.92760.8928130.94490.93160.8987140.94770.93520.904150.95030.93840.9088160.95260.94130.9132170.95470.94390.9171180.95660.94630.9207190.95830.94840.924200.95990.95040.927210.96140.95230.9297220.96270.9540.9323230.9640.95560.9347240.96520.95710.9369250.96630.95840.939260.96730.95970.9409270.96830.96090.9427280.96920.9620.9444290.970.96310.946300.97080.96410.9475310.97160.96510.9489320.97230.9660.9503330.9730.96680.9516340.97360.96760.9528350.97420.96840.9539360.97480.96910.955370.97540.96980.956380.97590.97050.957390.97640.97110.958400.97690.97170.9589410.97740.97230.9598420.97780.97280.9606430.97820.97340.9614440.97860.97390.9621450.9790.97440.9629460.97940.97480.9636470.97980.97530.9642480.98010.97570.9649490.98050.97620.9655500.98080.97660.9661510.98110.9770.9667520.98140.97730.9673530.98170.97770.9678540.9820.97810.9683550.98230.97840.9688560.98250.97870.9693570.98280.97910.9698580.98310.97940.9703590.98330.97970.9707600.98350.980.9711610.98380.98020.9716620.9840.98050.972630.98420.98080.9724640.98440.9810.9728650.98460.98130.9731660.98480.98150.9735670.9850.98180.9738680.98520.9820.9742690.98540.98220.9745700.98560.98250.9748710.98570.98270.9752720.98590.98290.9755730.98610.98310.9758740.98620.98330.9761750.98640.98350.9764800.98710.98440.9777900.98840.98590.97991000.98940.98720.98182000.99430.99310.99043000.9960.99520.99344000.99690.99640.9956000.99790.99750.99668000.99840.99810.997410000.99870.99850.997920000.99930.99920.9989附表三:单样本K-S检验临界表
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!