医学统计学04抽样误差.ppt

上传人:za****8 文档编号:13198204 上传时间:2020-06-07 格式:PPT 页数:38 大小:1.18MB
返回 下载 相关 举报
医学统计学04抽样误差.ppt_第1页
第1页 / 共38页
医学统计学04抽样误差.ppt_第2页
第2页 / 共38页
医学统计学04抽样误差.ppt_第3页
第3页 / 共38页
点击查看更多>>
资源描述
抽样误差SamplingError,Medicalstatistics医学统计学,2,主要内容(Content),抽样误差及其规律性标准误抽样分布与t分布总结,3,了解抽样误差规律的重要性,总体同质个体、个体变异,总体参数未知,样本代表性、抽样误差,随机抽样,样本统计量已知,统计推断,风险,4,两种研究思路,概率论:已知总体样本具有什么性质?统计学:已知样本总体具有什么性质?概率论:规律性中的随机性统计学:随机性中的规律性,5,抽样误差的定义,假如事先知道某地七岁男童的平均身高为119.41cm。为了估计七岁男童的平均身高(总体均数),研究者从所有符合要求的七岁男童中每次抽取100人,共计抽取了三次。,6,抽样误差的定义,三次抽样得到了不同的结果,原因何在?,7,【定义】由于个体变异的存在,在抽样研究中产生样本统计量和总体参数之间的差异,称为抽样误差(samplingerror)。各种参数都有抽样误差,这里我们以均数为研究对象,抽样误差的定义,8,抽样误差的表现,9,抽样误差的规律性,既然抽样误差是有规律的,那么它的分布规律到底是怎样的?,抽样误差是不可避免的!抽样误差是有规律的!,10,模拟试验,假设一个已知总体,从该总体中抽样,对每个样本计算样本统计量(均数、方差等),观察样本统计量的分布规律抽样分布规律。考察:不同的分布不同的样本含量对统计量的影响。,11,均数的模拟试验,从不同总体中进行抽样,观察均数的抽样分布规律。正态分布总体对数正态分布总体U型分布总体考察:样本均数的均数与总体均数有何关系?样本均数的标准差与总体标准差有何关系?样本均数的分布形状如何?不同的样本含量对上述性质的影响如何?,12,从已知正态总体中抽样,样本含量n=10抽样次数m=1000,13,SAMPLE1:x11x12x13x14.x1n,SAMPLE2:x21x22x23x24.x2n,SAMPLEk:xk1xk2xk3xk4.xkn,ASimulationStudy,原始总体,k个样本均数的频数分布图,14,模拟试验,随机现象的模拟系统,Samplingdistributionformeans,16,从正态总体中随机抽样,其样本均数服从正态分布;从任意总体中随机抽样,当样本含量足够大时,其样本均数的分布逐渐逼近正态分布;样本均数之均数的位置始终在总体均数的附近;随着样本含量的增加,样本均数的离散程度越来越小,表现为样本均数的分布范围越来越窄,其高峰越来越尖。,17,均数的抽样误差之特点,各样本均数未必等于总体均数;样本均数间存在差异;样本均数的分布很有规律,围绕总体均数,中间多两边少,左右基本对称;样本均数的变异范围较之原变量的变异范围大大缩小;随着样本含量的增加,样本均数的变异范围逐渐缩小。,18,中心极限定理(centrallimittheorem),Case1:从正态分布总体N(,)中随机抽样(每个样本的含量为n),可得无限多个样本,每个样本计算样本均数,则样本均数也服从正态分布。样本均数的均数为;样本均数的标准差为。,19,中心极限定理(centrallimittheorem),Case2:从非正态(nonnormal)分布总体(均数为,方差为)中随机抽样(每个样本的含量为n),可得无限多个样本,每个样本计算样本均数,则只要样本含量足够大(n50),样本均数也近似服从正态分布。样本均数的均数为;样本均数的标准差为。,20,标准误(standarderror),样本统计量的标准差称为标准误。样本均数的标准差称为均数的标准误。均数的标准误表示样本均数的变异度。当总体标准差未知时,用样本标准差代替,前者称为理论标准误,后者称为样本标准误。,21,标准误的意义,反映了样本统计量(样本均数,样本率)分布的离散程度,体现了抽样误差的大小。标准误越大,说明样本统计量(样本均数,样本率)的离散程度越大,即用样本统计量来直接估计总体参数越不可靠。反之亦然。标准误的大小与标准差有关,在例数n一定时,从标准差大的总体中抽样,标准误较大;而当总体一定时,样本例数越多,标准误越小。说明我们可以通过增加样本含量来减少抽样误差的大小。,22,与样本含量的关系,n越大,均数的均数就越接近总体均数;n越大,变异越小,分布越窄;对称分布接近正态分布的速度,大于非对称分布。分布越偏,接近正态分布所需样本含量就越大。,23,抽样误差的规律性(1),均数的抽样误差规律:在样本含量足够大时,无论总体分布如何,其均数的分布趋于正态分布(大数定律)在样本含量较小时:总体为正态分布时:正态分布总体为非正态分布时:?,24,正态分布的标准化变化,若XN(,),则。,因,则。,25,从N(0,1)中1000次抽样的u值的分布(n=4),Fraction,u,-4,-3,-2,-1,0,1,2,3,4,0,.05,.1,.15,.2,均数为0.007559标准差为1.006294,26,t分布的概念,实际工作中,总体方差未知。所以,用样本方差代替总体方差,此时的分布如何?,27,从N(0,1)中1000次抽样的t值的分布(n=4),Fraction,t,-8,-6,-4,-2,0,2,4,6,8,0,.05,.1,.15,.2,.25,.3,.35,均数为0.05696标准差为1.55827,28,t分布的概念,用样本方差代替总体方差,此时不服从正态分布。而服从t分布。记为:,29,t分布,1908年Gosset以笔名Student发表。故又称Studentt分布。t分布是一簇分布,与自由度有关。自由度:degreeoffreedom,30,t分布,t分布的高峰位置比u分布低,尾部重。即相同的尾部面积对应的界值,比u分布大。例如:P=0.05,u=1.96,而自由度为3的t分布界值,t=3.182。,31,自由度分别为1、5、时的t分布,t分布的图形,32,t分布的性质,t分布为一簇单峰分布曲线,高峰在0的位置上,说明从正态总体中随机抽样所得样本计算出的t值接近0的可能性较大。t分布以0为中心,左右对称。分布的高峰位置比u分布低,尾部高。t分布与自由度有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。每一自由度下的t分布曲线都有其自身分布规律。t界值表。,33,样本统计量的抽样分布,任何一个样本统计量均有其分布规律。从正态分布总体中抽样:均数的抽样分布为正态分布;样本方差的分布服从2分布;样本方差之比服从F分布;t值服从t分布;,34,抽样误差的规律性(2),t的抽样误差规律:总体为正态时:tt分布总体为非正态时:样本含量较大时:近似正态分布样本含量较小时:?,WilliamSealeyGosset18761937,35,抽样误差的规律性(3),方差的抽样误差规律:在正态总体时:方差的分布服从2分布。,KarlPearson18571936,36,抽样误差的规律性(4),方差比值的抽样误差规律:在正态总体时:方差之比的分布服从F分布。,RAFisher,37,研究抽样分布的目的,样本统计量的抽样分布规律是统计推断(statisticalinference)的理论基础。只有了解抽样分布规律,才能深刻理解统计推断的内涵。,38,ThankU,
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!