数理统计CH5假设检验52

上传人:lx****y 文档编号:243326209 上传时间:2024-09-21 格式:PPT 页数:75 大小:614.50KB
返回 下载 相关 举报
数理统计CH5假设检验52_第1页
第1页 / 共75页
数理统计CH5假设检验52_第2页
第2页 / 共75页
数理统计CH5假设检验52_第3页
第3页 / 共75页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第五章 假设检验,Hypothesis Testing,(SignificanceTest),假设检验是数理统计学中最重要的问题之一,与参数估计并称为数理统计学的两类基本问题。,2024/9/21,1,本章内容,5,假设检验,5.1,假设检验原理,5.2,正态总体均值,Z,检验,5.3,正态总体均值,t,检验,5.4,正态总体方差,2,检验,5.5,正态总体均值差,t,检验,5.6,正态总体方差比,F,检验,5.7,分布拟合,2,检验,2024/9/21,2,本章重点,5,假设检验,正态总体均值,t,检验,正态总体方差,2,检验,正态总体均值差,t,检验,正态总体方差比,F,检验,分布拟合,2,检验,2024/9/21,3,5.7,分布拟合,2,检验,Chi-square test on,goodness of fit,5,假设检验,2024/9/21,4,本章内容,5.7.1,分布拟合检验原理,5.7.2,离散样本分布拟合,检验,5.7.3,连续样本分布拟合检验,5.7,分布拟合,2,检验,2024/9/21,5,什么是分布拟合检验?,若,不知道,总体,X,服从什么分布,可从,总体,X,中抽取一个样本,x,1,x,2,x,n,,做样本的频数统计,根据直观印象或经验假定,X,服从某种已知分布,再由样本提供的信息对这一假设进行检验,称作分布拟合检验,或称拟合优度检验,(,significance testing on,goodness of fit,),或适合性检验。,5.7,分布拟合,2,检验,2024/9/21,6,5.7.1,分布拟合检验原理,Chi-square test mechanism,5.7,分布拟合,2,检验,2024/9/21,7,(1),关于分布的统计假设,5.7.1,分布拟合检验原理,对总体,X,概率分布的推测可归结为下面的统计假设:,H,0,:,F,(,x,),=,F,0,(,x,),H,1,:,F,(,x,),F,0,(,x,),H,0,:,f,(,x,),=,f,0,(,x,),H,1,:,f,(,x,),f,0,(,x,),或,F,0,(,x,),和,f,0,(,x,),称作拟合函数,问题,:总体,X,的概率分布未知,其分布函数记作,F,(,x,),,概率密度记作,f,(,x,),。若假定总体,X,服从某已知的概率分布,F,0,(,x,),及,f,0,(,x,),,试由样本,x,1,x,2,x,n,提供的信息,对此假设作出检验,2024/9/21,8,(2),KPearson,定理,组观测频数,n,j,组期望频数,np,j,组概率,p,j,组序号,j,组数,m,样本容量,n,5.7.1,分布拟合检验原理,1900,年,,K Pearson,提出了一个检验分布假设的统计量,用于描述假定的分布函数,F,0,(,x,),拟合样本的优度,即下面的,2,统计量:,2024/9/21,9,(2),KPearson,定理,H,0,:,f,(,x,),=,f,0,(,x,),H,1,:,f,(,x,),f,0,(,x,),拟合总误差的量度,5.7.1,分布拟合检验原理,2024/9/21,10,Pearson,定理,:零假设,H,0,下,不论总体,X,服从什么,分布,,Pearson,2,统计量在,n,趋于无限大时服从自由度,m-r-,1,的,2,分布。,根据大数定律,只要,n,充分大,(,50,),,就可利用自由度,m-r-,1,的,Pearson,2,统计量检验用,F,0,(,x,),或,f,0,(,x,),拟合样本分布的优度。其中,,m,为样本频数分布的分组数,,r,为确定,F,0,(,x,),或,f,0,(,x,),所需估计的参数个数,,n,为样本容量。,H,0,:,f,(,x,),=,f,0,(,x,),H,1,:,f,(,x,),f,0,(,x,),(2),KPearson,定理,5.7.1,分布拟合检验原理,2024/9/21,11,统计假设中指定的已知函数,F,0,(,x,),或,f,0,(,x,),称作,拟合函数,(,fit function,),;,进行分布拟合检验,首先要,确定拟合函数,F,0,(,x,),或,f,0,(,x,),,即它的分布类型和分布参数;,对,样本进行频数统计,根据对频数分布柱形图或直方图的直观印象、或以往经验、或类似问题的研究结论,先确定拟合函数,F,0,(,x,),或,f,0,(,x,),的分布类型,再用样本数据估计拟合函数,F,0,(,x,),或,f,0,(,x,),中的参数。,(3),确定拟合函数,H,0,:,f,(,x,),=,f,0,(,x,),H,1,:,f,(,x,),f,0,(,x,),5.7.1,分布拟合检验原理,2024/9/21,12,(4),组概率的计算,连续变量样本,组概率计算,H,0,:,f,(,x,),=,f,0,(,x,),H,1,:,f,(,x,),f,0,(,x,),5.7.1,分布拟合检验原理,2024/9/21,13,(4),组概率的计算,离散变量样本,组概率计算,H,0,:,f,(,x,),=,f,0,(,x,),H,1,:,f,(,x,),f,0,(,x,),5.7.1,分布拟合检验原理,2024/9/21,14,(5),KPearson,2,统计量的计算,KPearson,2,统计量的算法公式,(,数据处理,),5.7.1,分布拟合检验原理,2024/9/21,15,f,(,x,),偏离,f,0,(,x,),愈大,表征拟合总偏差的,Pearson,2,统计量的值就愈大,当值大到显著不合理的程度,(,p,),,就否定,f,(,x,),=,f,0,(,x,),的假设,故采用如下所示的右方,2,检验:,H,0,:,f,(,x,),=,f,0,(,x,),H,1,:,f,(,x,),f,0,(,x,),(6),2,分布拟合检验,p,否定,H,0,p,接受,H,0,5.7.1,分布拟合检验原理,2024/9/21,16,(6),2,分布拟合检验,决策规则,p,否定,H,0,p,接受,H,0,H,0,:,f,(,x,),=,f,0,(,x,),H,1,:,f,(,x,),f,0,(,x,),右侧,2,检验,5.7.1,分布拟合检验原理,2024/9/21,17,(6),2,分布拟合检验,H,0,:,f,(,x,),=,f,0,(,x,),H,1,:,f,(,x,),f,0,(,x,),Pearson,2,统计量的值在拒绝域内就拒绝,H,0,右侧,2,检验,5.7.1,分布拟合检验原理,2024/9/21,18,5.7.2,离散样本分布拟合检验,Chi-square test based discrete samples,5.7,分布拟合,2,检验,2024/9/21,19,问题,:一枚骰子掷,60,次,观测到的骰子点数,分布如下表,试检验这枚骰子是否公正,(1),案例资料,5.7.2,离散样本分布拟合检验,2024/9/21,20,步骤,1,:确定,H,0,下的拟合函数,p,j,步骤,2,:将问题表述为下面的统计假设,H,0,:,p,j,=,1/6,,,j,=,1,2,3,4,5,6,H,1,:,p,j,不全相等,检验步骤,5.7.2,离散样本分布拟合检验,(2),问题的右侧,2,检验,期望频数,2024/9/21,21,步骤,3,:计算,H,0,下,2,统计量的观察值,骰子点数,x,j,频数,n,j,组概率,p,j,期望频数,np,j,1,7,1/6,10,2,16,1/6,10,3,8,1/6,10,4,17,1/6,10,5,3,1/6,10,6,9,1/6,10,5.7.2,离散样本分布拟合检验,(2),问题的右侧,2,检验,2024/9/21,22,H,0,:,p,j,=,1/6,j,=,1,2,6,H,1,:,p,j,不全相等,观察拟合优度,5.7.2,离散样本分布拟合检验,(2),问题的右侧,2,检验,2024/9/21,23,步骤,4,:计算零假设,H,0,下发生,抽样观测事件,的概率,p,步骤,5,:决策,,p,=,0.0113,0.05,否定,H,0,,,0.05,水平上认定这枚骰子有缺限,不公正。,5.7.2,离散样本分布拟合检验,(2),问题的右侧,2,检验,2024/9/21,24,H,0,:,p,j,=,1/6,,,j,=,16,H,1,:,p,j,不全相等,因,p,值,0.0113,小于,0.05,,故否定,H,0,,,0.05,水平上认定骰子有缺限不公正,步骤,5,:做出决策,5.7.2,离散样本分布拟合检验,(2),问题的右侧,2,检验,2024/9/21,25,H,0,:,p,j,=,1/6,,,j,=,16,H,1,:,p,j,不全相等,因,2,值,14.8,在拒绝域内,故,0.05,水平上否定,H,0,,认定骰子有缺限不公正,步骤,5,:,5.7.2,离散样本分布拟合检验,(2),问题的右侧,2,检验,2024/9/21,26,5.7.3,连续样本分布拟合检验,Chi-square test based continuous samples,5.7,分布拟合,2,检验,2024/9/21,27,问题,:为搞清产品的重量,(,kg,),分布,某企业质检部门抽样检测了将要出厂的,49,台电冰箱的重量,,试依据样本检验电冰箱的重量是否服从正态分布。样本数据、,格式化分组及频率分布等详见后续的表格。,问题分析,:检验电冰箱重量是否为正态分布,可归结为检验样本频率分布与正态概率密度的拟合优度,(,逼近程度的显著性,),。,(1),案例资料,5.7.3,连续样本分布拟合检验,2024/9/21,28,61.5 49.0 47.1 59.0 51.2 42.2 53.7,55.6 45.2 48.6 50.7 54.1 40.3 57.1,61.6 51.6 50.1 54.1 38.8 47.1 55.3,60.7 50.7 42.8 50.8 43.6 50.0 53.1,51.7 49.8 52.6 45.8 42.5 46.7 55.9,47.0 51.7 51.1 61.0 46.0 48.3 43.8,46.7 55.5 47.9 43.9 52.6 51.5 63.0,电冰箱重量检测样本,(,参见实验,1),5.7.3,连续样本分布拟合检验,(1),案例资料,2024/9/21,29,(2),问题的右侧,2,检验,组序,组区间,组中值,频数,累积频数,频率,累积频率,1,(-,41),39,2,2,0.0408,0.0408,2,41,45),43,6,8,0.1224,0.1632,3,45,49),47,12,20,0.2449,0.4081,4,49,53),51,14,34,0.2857,0.6938,5,53,57),55,8,42,0.1633,0.8571,6,57,61),59,4,46,0.0816,0.9387,7,61,+,),63,3,49,0.0612,1.0000,电冰箱重量的频数频率分布表,步骤,1,:样本的数据分组和频数分布统计,5.7.3,连续样本分布拟合检验,2024/9/21,30,步骤,2,:将问题表述为下面的统计假设,H,0,:,总体,X,是正态分布,H,1,:,总体,X,是非正态分布,或,5.7.3,连续样本分布拟合检验,(2),问题的右侧,2,检验,2024/9/21,31,步骤,3,:确定,H,0,下拟合函数,F,0,(,x,),的表达式,5.7.3,连续样本分布拟合检验,(2),问题的右侧,2,检验,2024/9/21,32,步骤,3,:确定,H,0,下拟合函数,F,0,(,x,),的表达式,用极大似然估计或无偏估计确定参数,和,2,步骤,4,:计算,H,0,下样本分组的组概率,p,j,5.7.3,连续样本分布拟合检验,(2),问题的右侧,2,检验,2024/9/21,33,电冰箱重量频数分布表和组概率计算,步骤,4,:计算,H,0,下样本分组的组概率,p,j,组序,组区间,组中值,频数,p,j,n,j,2,/p,j,1,(-,41),39,2,0.0484,82.5908,2,41,45),43,6,0.1175,306.3020,3,45,49),47,12,0.2237,643.7554,4,49,53),51,14,0.2694,727.6329,5,53,57),55,8,0.2053,311.7812,6,57,61),59,4,0.0990,161.6675,7,61,+,),63,3,0.0367,244.9471,5.7.3,连续样本分布拟合检验,(2),问题的右侧,2,检验,2024/9/21,34,步骤,5,:计算,H,0,下,Pearson,2,统计量的观察值,5.7.3,连续样本分布拟合检验,(2),问题的右侧,2,检验,2024/9/21,35,步骤,6,:计算零假设,H,0,下发生,抽样观测事件,的概率,p,5.7.3,连续样本分布拟合检验,(2),问题的右侧,2,检验,2024/9/21,36,p,值愈大就拟合的愈好,或拟合优度愈高,5.7.3,连续样本分布拟合检验,(2),问题的右侧,2,检验,2024/9/21,37,因,p,值,0,.8114,大于,0.05,,故,0.05,水平上不能否定,H,0,,认定电冰箱重量服从正态分布,步骤,7,:做出决策,5.7.3,连续样本分布拟合检验,(2),问题的右侧,2,检验,2024/9/21,38,步骤,7,:做出决策,因,2,统计量值,1.5852,不在拒绝域内,故,0.05,水平上不能否定,H,0,,认定电冰箱重量服从正态分布,5.7.3,连续样本分布拟合检验,(2),问题的右侧,2,检验,2024/9/21,39,电冰箱的制造重量服从正态分布符合一般常识。但如果存在下述问题,也可能做出否定,H,0,的结论:,(1),电冰箱组件加工重量不稳定,波动较大;,(2),重量检测过程中存在较大的人为误差和仪器误差;,(3),存在异常数据记录或错误记录;,(4),电冰箱重量本身分散性较大,样本容量较小,统计量计算又有缺限,检验不出服从何分布,存在所谓的被误差淹没的问题。,(3),进一步的讨论,5.7.3,连续样本分布拟合检验,2024/9/21,40,5.7.4,注意事项,Notices,5.7,分布拟合,2,检验,2024/9/21,41,2,统计量自由度的计算公式为,df,=,m,-,r,-,1,,其中,m,是分组数,,r,是确定拟合函数时需要估计的分布参数的个数。若没有用样本数据估计分布参数,则,r=0,5.7.4,注意事项,(1),自由度,df,的计算,2024/9/21,42,因为,Pearson,2,统计量是近似服从自由度为,m,-,r,-,1,的,2,分布,故,样本容量,n,不能选的太小,样本容量,n,愈大则所计算的,p,值愈精确,决策结论愈可靠。,5.7.4,注意事项,(2),样本容量,n,的选择,2024/9/21,43,样本分组有相当大的任意性,它对检验结果有很大影响。,若分组数过小或组区间分割过宽,局部统计结果就会太粗,呈现的分布特征较弱,不利于鉴别频数分布与假设分布的差别;,若分组数过大或组区间分割过窄,组频数的统计结果就会不稳定,未能充分呈现频数分布的统计特征。,(3),样本的合理分组,5.7.4,注意事项,2024/9/21,44,若分组合理情况下仍存在概率过小的组,则该组的期望频数也小,从而使该组的频率偏差,n,j,/n-p,j,在,Pearson,2,统计量中,的权数,n/p,j,反而很大,导致该局部的统计量值过分大,它对,Pearson,2,统计量总值的影响份额与它自身的重要性不相称;,需按,np,j,5,规则,合并相邻组区间,,并重新计算抽样观测事件的概率,以使检验更可靠。,(4),期望频数过小问题,5.7.4,注意事项,2024/9/21,45,电冰箱重量频数分布表和组概率计算,组序,组区间,组中值,频数,p,j,np,j,1,(-,41),39,2,0.04843,2.37315,2,41,45),43,6,0.11753,5.75902,3,45,49),47,12,0.22369,10.96069,4,49,53),51,14,0.26937,13.19896,5,53,57),55,8,0.20527,10.05834,6,57,61),59,4,0.09897,4.84946,7,61,+,),63,3,0.03674,1.80039,按,np,j,5,规则,合并相邻组区间,重算统计量值,5.7.4,注意事项,(5),样本并组后的分布拟合检验,2024/9/21,46,电冰箱重量频数分布表和组概率计算,5.7.4,注意事项,按,np,j,5,规则,合并相邻组区间,重算统计量值,(5),样本并组后的分布拟合检验,2024/9/21,47,电冰箱重量频数分布表和组概率计算,5.7.4,注意事项,按,np,j,5,规则,合并相邻组区间,重算统计量值,(5),样本并组后的分布拟合检验,2024/9/21,48,计算,H,0,下,Pearson,2,统计量的观察值,5.7.4,注意事项,(5),样本并组后的分布拟合检验,2024/9/21,49,计算零假设,H,0,下发生,抽样观测事件,的概率,p,5.7.4,注意事项,(5),样本并组后的分布拟合检验,2024/9/21,50,确定,H,0,下右方,2,检验的拒绝域,5.7.4,注意事项,(5),样本并组后的分布拟合检验,2024/9/21,51,决策和结论,因,2,统计量的观察值,0.58897,接受,H,0,决策规则,5,假设检验,(1),均值,Z,检验,2024/9/21,55,5,假设检验,(1),均值,Z,检验,2024/9/21,56,5,假设检验,(2),均值差,Z,检验,适用于检验方差已知两正态总体均值差假设,2024/9/21,57,p,否定,H,0,p,接受,H,0,决策规则,(2),均值差,Z,检验,5,假设检验,2024/9/21,58,5,假设检验,(2),均值差,Z,检验,2024/9/21,59,5,假设检验,(3),均值,t,检验,适用于检验,方差未知单正态总体的均值假设,2024/9/21,60,(3),均值,t,检验,p,否定,H,0,p,接受,H,0,决策规则,5,假设检验,2024/9/21,61,(3),均值,t,检验,5,假设检验,2024/9/21,62,5,假设检验,(4),均值差,t,检验,适用于检验,方差未知两正态总体均值差假设,2024/9/21,63,(4),均值差,t,检验,p,否定,H,0,p,接受,H,0,决策规则,5,假设检验,2024/9/21,64,(4),均值差,t,检验,5,假设检验,2024/9/21,65,5,假设检验,(5),方差,2,检验,适用于检验,单正态总体的,方差假设,2024/9/21,66,p,否定,H,0,p,接受,H,0,决策规则,5,假设检验,(5),方差,2,检验,2024/9/21,67,5,假设检验,(5),方差,2,检验,2024/9/21,68,5,假设检验,(6),方差比,F,检验,适用于检验两正态总体的方差比假设,2024/9/21,69,p,否定,H,0,p,接受,H,0,决策规则,5,假设检验,(6),方差比,F,检验,2024/9/21,70,5,假设检验,(6),方差比,F,检验,2024/9/21,71,(7),2,分布拟合检验,5,假设检验,H,0,:,f,(,x,),=,f,0,(,x,),H,1,:,f,(,x,),f,0,(,x,),决策规则,p,否定,H,0,p,接受,H,0,2024/9/21,72,(7),2,分布拟合检验,H,0,:,f,(,x,),=,f,0,(,x,),H,1,:,f,(,x,),f,0,(,x,),5,假设检验,Pearson,2,统计量的值在拒绝域内就拒绝,H,0,2024/9/21,73,课堂小测验,总体,X,和,Y,的方差相同,从其中抽得两独立样本且其均值、校正平方和及容量用下述符号表示,5,假设检验,写出各统计量的表达式并证明原假设,H,0,的拒绝域为,假设,2024/9/21,74,结束,5,假设检验,2024/9/21,75,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!