抽样误差和参数估计-课件

上传人:无*** 文档编号:241369360 上传时间:2024-06-21 格式:PPT 页数:44 大小:666.50KB
返回 下载 相关 举报
抽样误差和参数估计-课件_第1页
第1页 / 共44页
抽样误差和参数估计-课件_第2页
第2页 / 共44页
抽样误差和参数估计-课件_第3页
第3页 / 共44页
点击查看更多>>
资源描述
抽样误差与参数估计抽样误差与参数估计南方医科大学生物统计系南方医科大学生物统计系谭旭辉谭旭辉抽样误差与标准误抽样误差与标准误Sampling error andstandard errorpopulationsample抽样实验抽样实验例例7-1:某地区正常成年男子的红细胞计某地区正常成年男子的红细胞计数服从正态分布数服从正态分布N(5.00,0.502)(1012/L),随随机抽取机抽取100份样本,每份样本含有份样本,每份样本含有10个个个体。个体。样本1样本2样本99样本3样本100正常男子红细胞计数抽样实验结果正常男子红细胞计数抽样实验结果No 红细胞计数红细胞计数s123991005.595.494.564.824.085.115.564.875.304.734.265.475.215.194.845.045.194.715.304.660.440.420.330.390.46抽样误差抽样误差通过对研究总体中随机抽取部分有通过对研究总体中随机抽取部分有代表性的样本,用代表性的样本,用统计量统计量(样本均(样本均数)来推断总体参数。数)来推断总体参数。由于抽样的随机性而造成样本统计由于抽样的随机性而造成样本统计量(样本均数)与总体量(样本均数)与总体参数参数(总体(总体均数)间的差别,称为均数的均数)间的差别,称为均数的抽样抽样误差。误差。从总体从总体N N(5.00,0.50(5.00,0.502 2)中抽样实验结果中抽样实验结果各样本均数未必等于总体均数各样本均数未必等于总体均数各样本均数之间也存在差异各样本均数之间也存在差异 样本均数的分布也是正态分布样本均数的分布也是正态分布样本均数的变异范围较原变量的变样本均数的变异范围较原变量的变异范围大大缩小异范围大大缩小样本均数的标准误样本均数的标准误统计上,将统计量(如样本均数、样本统计上,将统计量(如样本均数、样本率等)的标准差称为标准误率等)的标准差称为标准误,用以用以衡量衡量抽样误差的大小抽样误差的大小n n固定时,标准差越大,标准误越大固定时,标准差越大,标准误越大标准差固定时,标准差固定时,n n越大,标准误越小越大,标准误越小 实际工作中,总体标准差常未知实际工作中,总体标准差常未知例例72:已知某样本已知某样本 =5.03,s=0.52,n=10,试计算标准误。,试计算标准误。实际工作中,只能根据一份样本计算出实际工作中,只能根据一份样本计算出一个标准误说明抽样误差的大小,即一个标准误说明抽样误差的大小,即 估计估计的可靠程度的可靠程度例例73:2019年,在某地年,在某地20岁应征男青岁应征男青年中随机抽取年中随机抽取85人,平均身高为人,平均身高为171.2cm,标准差为,标准差为5.3cm,计算当地,计算当地20岁应征男岁应征男青年身高的标准误。青年身高的标准误。反映了本次调查身高均数反映了本次调查身高均数171.2cm的抽样的抽样误差大小(估计值)误差大小(估计值)样本率的标准误样本率的标准误率的标准误是衡量样本率的离散趋率的标准误是衡量样本率的离散趋势和率的抽样误差的统计指标。势和率的抽样误差的统计指标。总体:总体:样本:样本:例例1:观察某医院产妇观察某医院产妇106人,其中人,其中行剖腹产者行剖腹产者62人,剖腹产率为人,剖腹产率为58.5%,试估计剖腹产率的标准误。,试估计剖腹产率的标准误。样本均数的分布样本均数的分布原分布为正态分布,则新分布也为正态原分布为正态分布,则新分布也为正态分布,如原分布为非正态分布,当分布,如原分布为非正态分布,当n足足够大时够大时(如如n60),新分布也近似正态分新分布也近似正态分布布新分布可用样本均数的均数和均数的标新分布可用样本均数的均数和均数的标准差来描述其特征,其理论值分别为准差来描述其特征,其理论值分别为t分布分布(t-distribution,student distribution,Gosset,1908)t分布特征分布特征单峰分布,以单峰分布,以t=0为中点,两侧对为中点,两侧对称;称;样本样本(自由度自由度)越小,越小,t分布曲线峰分布曲线峰值越低,值越低,t值越分散;值越分散;随着自由度的增大,随着自由度的增大,t分布接近于分布接近于标准正态分布,当标准正态分布,当时,时,t分布分布的极限分布是标准正态分布。的极限分布是标准正态分布。图中阴影部分表示图中阴影部分表示t/2,以外尾部面以外尾部面积占总面积的百分比积占总面积的百分比P同一同一时,时,t与与P呈反向关系呈反向关系当当=时,时,t/2,=u/2当当相同时,单侧相同时,单侧P与双侧与双侧2P对应相对应相同的同的t界值界值,如如t0.05,=t0.10/2,可可(置置)信区间信区间Confidence interval,CI统计推断统计推断参数估计参数估计假设检验假设检验点估计点估计区间估计区间估计点估计点估计(point estimation):就是用样本指就是用样本指标直接地估计总体指标。标直接地估计总体指标。总体均数总体均数总体率总体率即样本均数和样本率分别是总体均数即样本均数和样本率分别是总体均数和总体率的估计值。和总体率的估计值。区间估计区间估计(confidence interval estimation)指用指用 和和 确定一个具有确定一个具有较大置信度的包含总体参数的区间,该较大置信度的包含总体参数的区间,该区间包含总体均数的概率为区间包含总体均数的概率为1-,称为总称为总体均数的体均数的1-可信区间。可信区间。1-一般取一般取0.95或或0.99。样本统样本统计量计量标准误的标准误的估计值估计值总体均数的可信区间总体均数的可信区间1.未知时,按未知时,按t分布的原理分布的原理 的概率之和为的概率之和为2.已知时,或已知时,或 未知但未知但n足够大足够大n足够大,用样本标准足够大,用样本标准差差S来估计来估计例例74:已知某样本的已知某样本的 ,s=0.52,n=10,试计算该总体正常成年男子平均红细,试计算该总体正常成年男子平均红细胞计数的胞计数的95%可信区间。可信区间。解:解:v=9,=0.05(双侧),查双侧),查t界值表,得界值表,得例例75:试估计试估计2019年当地年当地20岁应征男岁应征男青年身高总体均数的青年身高总体均数的95%可信区间。可信区间。解:解:n=85,大样本时,大样本时 用用 代替代替可信区间的解释可信区间的解释从总体中做随机抽样,据每个样本可算从总体中做随机抽样,据每个样本可算得一个可信区间,如得一个可信区间,如95%可信区间意味可信区间意味着做着做100次抽样,算得次抽样,算得100个可信区间,个可信区间,平均有平均有95个包括个包括,只有只有5个不包括。个不包括。实际工作中实际工作中,为估计总体均数,我们只做为估计总体均数,我们只做一次抽样一次抽样,只算得一个可信区间,用以估只算得一个可信区间,用以估计计 的范围,理论上有的范围,理论上有95%的可能是正的可能是正确的确的(1-),只有只有5%的可能发生错误。的可能发生错误。可信区间两个要素可信区间两个要素1.准准确确度度:反反映映可可信信度度(1-)的的大大小小。1-越越接近接近1,越准确,越准确 如可信度如可信度99%比比95%准确准确2.精确度:精确度:反映区间范围宽窄。范围越窄越好反映区间范围宽窄。范围越窄越好 95%可信区间精度优于可信区间精度优于99%1.1.在在n n确定的情况下,准确度确定的情况下,准确度,精确度,精确度;2.2.在在兼兼顾顾准准确确度度和和精精确确度度时时,一一般般取取95%95%可可信信区间区间;3.3.在可信度确定的情况下,增加样本例数,可在可信度确定的情况下,增加样本例数,可提高精确度提高精确度;两样本均数之差的分布与标准误两样本均数之差的分布与标准误从两个正态总体从两个正态总体 中随机抽样,分别得中随机抽样,分别得n1、s1和和n2、s2 则:则:如果两总体标准差未知如果两总体标准差未知合并方差合并方差两总体均数之差的估计两总体均数之差的估计两总体均数之差两总体均数之差1-2的的1-可信区间可信区间为为:大样本时总体均数的可信区间大样本时总体均数的可信区间例例7 77 7:某药治疗流行性乙型脑炎,将某药治疗流行性乙型脑炎,将7272名患者随机分为试验组和对照组,得名患者随机分为试验组和对照组,得两组退热天数结果如下,试估计该药是两组退热天数结果如下,试估计该药是否有效。否有效。分组分组nS试验组试验组322.91.9对照组对照组405.22.71 1-2 2 的的95%95%可信区间可信区间总体率的区间估计总体率的区间估计正态近似法正态近似法 当当n足够大,且样本率足够大,且样本率p 和和(1-p)均不太小,如均不太小,如np和和n(1-p)均大于均大于5时,时,p的抽样分布接近正态分布,按正态分的抽样分布接近正态分布,按正态分布的原理。布的原理。求求例例1中剖腹产率的中剖腹产率的95%可信区间:可信区间:(0.585-1.960.048,0.585+1.960.048)即(即(0.491,0.679)查表法:查表法:当不满足正态分布应用条当不满足正态分布应用条件时,可根据二项分布的原理直接件时,可根据二项分布的原理直接计算概率。阳性数为计算概率。阳性数为X的概率的概率例例5-2:某妇幼保健院对当地某妇幼保健院对当地38例育龄夫例育龄夫妇的筛查中,检出妇的筛查中,检出-地中海贫血基因携地中海贫血基因携带者带者3例,试估计当地例,试估计当地-地中海贫血基因地中海贫血基因总体携带率的总体携带率的95%可信区间。可信区间。查附表查附表7(P333),X=3,n=38,得,得221,即该地即该地-地中海贫血基因总体携带率的地中海贫血基因总体携带率的95%可信区间为可信区间为2%-21%。F注注意意:附附表表7只只列列出出了了发发生生数数Xn/2(发发生生率率50%)的的部部分分。当当Xn/2时时,应应按按n-X值值查查表表,并并相相应应地地用用100减减去去查查得得的数值,即为所求可信区间。的数值,即为所求可信区间。两率之差的分布与标准误两率之差的分布与标准误两总体率之差的估计两总体率之差的估计两总体率之差两总体率之差1-2的的1-可信区间可信区间为为:例例7-8标准差和标准误的比较标准差和标准误的比较标准差标准差SD标准误标准误SE意义意义个体变异大小个体变异大小抽样误差大小抽样误差大小用途用途CV,参考值范围参考值范围CI,假设检验,假设检验计算计算随随n增加增加渐趋于稳定渐趋于稳定渐趋于渐趋于0(1-)100%参考值范围与可信区间参考值范围与可信区间的区别的区别含义含义 前者指该区间包含了前者指该区间包含了(1-)100%的的观观察值;后者指该区间包含总体均数察值;后者指该区间包含总体均数的可能性是的可能性是(1-)100%。计算(双侧)计算(双侧)参考值范围参考值范围可信区间可信区间小 结标准差和标准误的比较标准差和标准误的比较区间估计和医学参考值范围的区别区间估计和医学参考值范围的区别可信区间的涵义可信区间的涵义docin/sanshengshiyuandoc88/sanshenglu 更多精品资源请访问更多精品资源请访问
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!