数值变量资料的统计推断两组资料

上传人:dja****22 文档编号:243386093 上传时间:2024-09-22 格式:PPT 页数:31 大小:753KB
返回 下载 相关 举报
数值变量资料的统计推断两组资料_第1页
第1页 / 共31页
数值变量资料的统计推断两组资料_第2页
第2页 / 共31页
数值变量资料的统计推断两组资料_第3页
第3页 / 共31页
点击查看更多>>
资源描述
Click to edit Master title style,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,Sunday, September 22, 2024,数值变量资料的统计推断,两组资料均数的比较,两组资料均数的比较,第一节 均数的抽样误差,第二节,t,分布与可信区间,第三节,t,检验,第四节 假设检验的步骤,及其有关概念,总体,样本,抽取部分观察单位,统计量,参 数,统计推断,统计推断,statistical inference,如:样本均数,样本标准差,S,样本率,p,如:总体均数,总体标准差,总体率,内容:,参数估计,(estimation,of,parameters),包括:点估计与区间估计,2.,假设检验,(,test of hypothesis),随机,总体,样本,抽取部分观察单位,统计量,参 数,统计推断,第一节 均数的抽样误差,如:,样本均数,样本标准差,S,样本率,P,如:,总体均数,总体标准差,总体率,抽样误差,(sampling error) :,由于个体差异导致的,样本,统计量与,总体,参数以及各样本统计量间的差别。,一、抽样试验,从正态分布总体,N,(,5.00,0.50,)中,每次随机抽取样本含量,n,5,,并计算其均数与标准差;重复抽取,1000,次,获得,1000,份样本;,计算,1000,份样本的均数与标准差,并对,1000,份样本的均数作直方图。,按上述方法再做样本含量,n,10,、样本含量,n,30,的抽样实验;比较计算结果。,抽样试验(,n,= 5),抽样试验(,n,= 10),抽样试验(,n,= 30),1000,份样本抽样计算结果,X,标准误(,即,抽样误差,),的大小:,与,S,成正比与,n,成反比,;,S,一定时,增大,n,可减小,抽样误差,3个抽样实验结果图示,抽样实验小结,均数的均数,围绕总体均数上下波动。,均数的标准差,即,标准误,与总体标准,差 相差一个常数的倍数,即,样本,均数的标准误(,Standard Error),=,样本标准差,/,从正态总体,N,(,m,s,),中抽取样本,获得均数的分布仍近似呈,正态分布,N,(,m,s,/,n,),。,二、中心极限定理 central limit theorem,即使从,非正态总体,中抽取样本含量足够大时(如n30),所得均数分布仍近似呈,正态,。,随着样本量的增大, 样本均数的,变异,范围也逐渐变窄。,X 1,S,1,X 2,S,2,X I,S,i,X n,S,n,x,标准误示意图,标准误的应用,(1)表示抽样误差的大小;,(2)表示样本均数(,x,)代表总体均数,(,)的可靠程度:,x,S,x,;,(3)估计总体均数的可信区间;,(4)假设检验。,第二节,t,分布与可信区间,一、,t,分布(,t,distribution),二、总体均数的估计,1. 总体均数的点估计(point estimation),与区间估计,2. 总体均数的可信区间(confidence,interval,CI),3. 总体均数差的可信区间,4. 大样本总体均数的可信区间,三、可信区间的解释,一、,t,分布,随机变量,N,(,m,,,s,),标准正态分布,N,(,0,,,1,),u,变换,均数,N,(, ),标准正态分布,N,(,0,,,1,),t,分布,自由度:,n,-1,t,分布的概率密度函数,式中 为伽玛函数; 圆周率(Excel函数为PI( )),为自由度(degree of freedom),是,t,分布的唯一参数;,t,为随机变量。,以,t,为横轴,,f,(,t,)为纵轴,可绘制,t,分布曲线。,t,分布曲线,t,分布,有如下性质:,单峰分布,曲线在,t,0 处最高,并以,t,0为中心左右对称,与正态分布相比,曲线最高处较矮,两,尾部翘得高,(如V=5或1),随自由度增大,曲线逐渐接近正态分布;分布的极限为标准正态分布。, = (,t,u), = 5, = 1,t,分布曲线下面积,(附表9-1),双侧,t,0.05/2,9,2.262,单侧,t,0.025,9,单侧,t,0.05,9,1.833,双侧,t,0.01/2,9,3.250,单侧,t,0.005,9,单侧,t,0.01,9,2.821,双侧,t,0.05/2,,1.96,单侧,t,0.025,,单侧,t,0.05,,1.64,根据,t,分布的变化特征,归纳以下两点:,在相同的,P,条件下,,越小,,t,值越大、,越大,,t,值越小。,在相同的,条件下,,P,越小,,t,值越大。,即:,t,值越大、,P,越小,t,值越小、,P,越大,在相同的,t,值,、,条件下,,双侧概率,P,为单侧,概率,P,的两倍、,或,单侧,概率,P,为,双侧概率,P,的一半。,即,t 值表规律:,自由度(,),一定时,,P,与,t,成反比,;,概率(,P,),一定时,,与,t,成反比,;,二、,总体均数的估计,总体均数的点估计(,point estimation,),与区间估计,:,参数的估计,点估计,:由样本统计量,直接估计 总体参数,区间估计,:考虑抽样误差的影响,、,在一定,可信度,(Confidence level)下,计算出包含有未知总体均数的,一个,范围,,即为。,可信度与可信区间,区间的,可信度,(如95或99)是重复抽样(如1000次)时,样本(如,n,= 5)区间包含总体参数(,m,)的百分数(,概率,)。,常用,(1-,),表示,可信度,值一般取0.05或0.01。,总体均数区间估计(1):,虽,不知,但,n 足够大,(,100或50)时,的平均数 接近正 态分布,则:按正态分布原理,总体均数95%可信区间:,1.96, S,总体均数99%可信区间:,2.58, S,-,-,大样本总体均数的可信区间(1),总体均数区间估计(2):,当,已知,无论 n 多大,用正 态分布法,则:,总体均数95%可信区间:, 1.96,总体均数99%可信区间:, 2.58,-,-,总体均数区间估计(3):,当,不知,且,n 为小样本,(如100或50)时,则:按,t,分布法,总体均数的可信区间,例:,三、可信区间的解释,95可信区间,:从总体中作随机抽样,作100次抽样,每个样本可算得一个可信区间,得100个可信区间,平均有95个可信区间包括,(估计正确),只有5个可信区间不包括,(估计错误)。,95可信区间 99可信区间,公式,区间范围 窄 宽,估计错误的概率 大(0.05) 小(0.01),可信区间与参考值范围的区别,区别,总体均数可信区间,参考值范围,(1),含,义,按预先给定的概率,确定的未知参数,的可能范围。实际上一次抽样算得的可信区间要么包含了总体均数,要么不包含。但可以说:当,=0.05,时,,95%CI,估计正确的概率为,0.95,,估计错误的概率小于或等于,0.05,,即有,95%,的可能性包含了总体均数。,“正常人”的解剖,生理,生化某项指标的波动范围。,可信区间与参考值范围的区别,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!