抽样推断-2抽样误差

上传人:san****019 文档编号:20663691 上传时间:2021-04-11 格式:PPT 页数:41 大小:635KB
返回 下载 相关 举报
抽样推断-2抽样误差_第1页
第1页 / 共41页
抽样推断-2抽样误差_第2页
第2页 / 共41页
抽样推断-2抽样误差_第3页
第3页 / 共41页
点击查看更多>>
资源描述
2021年 4月 11日 1 第五章 抽样推断 第二节 抽样误差 (本章的重点和难点 ) 2021年 4月 11日 2 内容体系 一、抽样误差的意义 (一)抽样误差 (二)抽样误差产生的原因 (三)影响抽样误差大小的因素 二、抽样平均误差 (一)样本平均数的抽样平均误差 (二)样本成数的抽样平均误差 三、抽样极限误差 抽样极限误差的含义和定义公式 四、概率度 t和置信度 F(t) 抽样误差的理 论问题 抽样误差的计 算和控制问题 并给出 参数估 计 的基本思想 2021年 4月 11日 3 一、抽样误差的意义 抽样误差的大小表明 抽样效果 的好坏,抽样误差越小, 样本的代表性越高;反之,越低 (一 )抽样误差的含义 指按照 随机原则,从总体中抽出样本, 由于样本的结 构与总体的结构有差距,从而引起的样本指标和全及 指标之间的离差 . 离差的正负没有区别,所以经常用绝对离差表示抽样 误差 计算抽样误差时,一般假定不存在登记性误差和系统误 差 Xx Pp 2021年 4月 11日 4 (二)抽样误差产生的原因 用调查中的误差来源来说明 2021年 4月 11日 5 调查中的误差来源 调查中 的误差 登记性误差 (工作性误差 ) 代表性误差 偶然性的 代表性误差 系统性的 代表性误差 是差错, 可以尽可 能地避免 抽样误差。 不是差错, 不可避免, 随机抽样特 有的,可以 计算并控制 违反随机原则 抽样,可避免 2021年 4月 11日 6 (三 )影响抽样误差大小的因素 1.总体各单位标志值的差异程度 或 2 正向关系 2.样本容量的大小 n 反向关系 Pp Xx Nn Nn l i m l i m 2021年 4月 11日 7 影响抽样误差大小的因素 (续 ) 3.抽样方法 重复 /不重复 不重复抽样的误差 重复抽样的误差 4.抽样调查的组织形式 等距抽样、分层抽样 简单随机抽样 整群抽样 2021年 4月 11日 8 影响抽样误差大小的因素 (续 ) 1.总体各单位标志值的差异程度 或 2 2.样本容量的大小 n 3.抽样方法 重复 /不重复 4.抽样调查的组织形式 客观存在无 法改变 主观 确定 目标: 主观确定 2、 3、 4来适应 1,使 误差控制在我们期望的范围之内 2021年 4月 11日 9 抽样平均误差引论 个别样本的抽样误差 【 例 】 设一个总体 , 含有 4个元素 (个体 ), 即总体单位 数 N=4。 4个单位的变量值分别为 X1=1、 X2=2、 X3=3 、 X4=4。 总体的均值 =2.5 现从总体中抽取 n 2的简单随机样本 在考虑顺序重复抽样条件下 , 共有多少个样本 ? 42=16个样本 把所有可能的样本列到下面的表格中: 3,4 3,3 3,2 3,1 3 2,4 2,3 2,2 2,1 2 4,4 4,3 4,2 4,1 4 1,4 4 1,3 3 2 1 1,2 1,1 1 第二个观察值 第一个 观察值 所有可能的 n = 2 的样本(共 16个) 3.5 3.0 2.5 2.0 3 3.0 2.5 2.0 1.5 2 4.0 3.5 3.0 2.5 4 2.5 4 2.0 3 2 1 1.5 1.0 1 第二个观察值 第一个 观察值 16个样本的均值( x) 计算出各样 本的均值 计算出各样本的抽样误差 1.0 0.5 0 0.5 3 0.5 0 0.5 1.0 2 1.5 1.0 0.5 0 4 0 4 0.5 3 2 1 1.0 1.5 1 第二个观察值 第一个 观察值 16个样本的抽样误差 Xx 个别样本的 抽样误差 所有样本的 平均抽样误 差怎样来表 示呢? 2021年 4月 11日 12 是所有可能样本的样本指标与总体指标的 平均离差。 x 样本平均数的抽样平均误差 p 样本成数的抽样平均误差 M )Xx( x 2 M )Pp( p 2 二、抽样平均误差 上式被称为抽样平均误差的 理论公式 ,为什么? 1.总体指标未知 2.实践中只会抽取一个样本,不会抽出所有可能的样本 2021年 4月 11日 13 抽样平均误差又称为抽样标准误 可以变 换为: M )x(Ex x 2 M )p(Ep p 2 前提条件: XxE )( PpE )( 中心极限 定理已经 证明了 M )Xx( x 2 M )Pp( p 2 2021年 4月 11日 14 nnx 2 可以看出, x与 成正比,与 n的平方根成反比 抽样平均误差的实际计算公式 (一)样本平均数的抽样平均误差 x 1、重复抽样条件下 5.21 N X X N i i 25.1 )( 1 2 2 N XX N i i 抽样平均误差性质讨论 (1)样本平均数的平均数是不是总体平均数 ? (2)抽样平均误差是不是样本平均数的标准差 ? (3)抽样平均误差与总体标准差的计算关系是什么 ? 【 例 】 设一个总体 , 含有 4个元素 (个体 ) , 即总体 单位数 N=4。 4个单位的变量值分别为 X1=1、 X2=2、 X3=3 、 X4=4 。 总体的均值 、 方差 2021年 4月 11日 16 从总体中抽取 n 2的简单随机样本 , 在考虑顺序重复抽样 条件下 , 共有 42=16个可能的样本 3,4 3,3 3,2 3,1 3 2,4 2,3 2,2 2,1 2 4,4 4,3 4,2 4,1 4 1,4 4 1,3 3 2 1 1,2 1,1 1 第二个观察值 第一个 观察值 所有可能的 n = 2 的样本(共 16个) 抽样平均误差性质讨论 2021年 4月 11日 17 计算出各样本的均值 抽样平均误差性质讨论 3.5 3.0 2.5 2.0 3 3.0 2.5 2.0 1.5 2 4.0 3.5 3.0 2.5 4 2.5 4 2.0 3 2 1 1.5 1.0 1 第二个观察值 第一个 观察值 16个样本的均值( x) 2021年 4月 11日 18 抽样分布 P ( x ) 1.0 0 .1 .2 .3 1.5 3.0 4.0 3.5 2.0 2.5 x 5.2 M x x 625.02 x 79.02 x 总体分布 X = 2.5 12.12 25.12 抽样平均误差性质讨论 2021年 4月 11日 19 x M i i x n M xx 2 25.1 79.0625.0 16 )5.20.4()5.20.1( )( 2 22 1 2 5.2 16 0.45.10.1 1 M x x M i i 抽样平均误差性质讨论 2021年 4月 11日 20 XxxE ( 1)样本平均数的平均数等于总体平均数 ( 2)抽样平均误差仅为总体标准差的 n 1 ( 3)可以通过调整样本单位数 n来控制抽样平均 误差的大小 抽样平均误差性质讨论 是总体参数 客观存在不可 改变 2021年 4月 11日 21 性质举例: 将样本容量增加 3倍,则抽样平均误差会 缩小一半 n 2 1 2 1 4 nn 2 2 n nn 56.1 64.0 1 %80 2 2 2 2 )(56.1 倍nn 抽样平均误差减少 20%,则样本容量就需要变为原来的 1.56倍 2021年 4月 11日 22 (一)样本平均数的抽样平均误差 x 2、不重复抽样条件下 1 2 N nN nx 在总体单位数 N很大的情况下, N-1N ) N n( nN nN nx 1 22 近似表 示为: 有限总体 修正系数 抽样比 2021年 4月 11日 23 总体标准差未知时的处理 2未知,怎么办? 1.以往的经验数据 2.以样本方差近似代替 nnx 2 1 2 N nN nx 2021年 4月 11日 24 n )P(P np 12 1、 重复抽样条件下 (二)样本成数的抽样平均误差 p 2、不重复抽样条件下 1 )1( 1 2 N nN n PP N nN np 在 N很大的情况下, 可近似表示为: N n n PP p 1 )1( 2=P(1-P) P未知,一 般以 p替代 2021年 4月 11日 25 说明 重复抽样的 x都要大于不重复抽样的 x ,因 为有限总体修正系数 1-n/N1; 但是,在 n/N很小时,二者相差甚微,所以, 当 n/N0.01时 ,直接将不重复抽样按重复 抽样来计算 以上结论都是在 简单随机抽样 的前提下得出 的,在其他抽样组织形式下公式会有差异 2未知 时,要会合理的替代 2021年 4月 11日 26 抽样平均误差例题分析 P192例 5-3 要求: 按产品质量要求,耐用时数达到和超过 1000小时为合 格品,求该批灯管平均耐用时数和合格率的抽样平均误差。 耐用时数 (小时) 900 以下 4 850 3400 - 2 7 3 298116 9 0 0 1 0 0 0 6 950 5700 - 1 7 3 179574 1 0 0 0 1 1 0 0 50 1050 52500 - 7 3 266450 1 1 0 0 1 2 0 0 120 1150 13800 27 87480 1200 以上 20 1250 25000 127 322580 合计 200 224600 1154200 抽样平均误差计算表 灯管数 (个) 组中值 f x xf xx f)xx( 2 N=10000 2021年 4月 11日 27 解答 解:根据表中资料 , 计算得到: 200支灯管的平均耐用时数 )(1 1 2 32 0 02 2 4 6 0 0 小时 f xf x 耐用时数的标准差 灯管的合格率 )(97.75 2 0 0 1 1 5 4 2 0 0)( 2 小时 f fxx x %nnp 951 2021年 4月 11日 28 重复抽样 灯管平均耐用时数的抽样平均误差 375 200 9775 . nx 灯管合格率的抽样平均误差 %.% n )p(p p 541200 5951 2021年 4月 11日 29 不重复抽样 灯管平均耐用时数的抽样平均误差 325212 0 097751 22 .%)(.)Nn(nx 灯管合格率的抽样平均误差 %.%)(%)Nn(n )P(Pp 53121200 59511 2021年 4月 11日 30 n PP n px )1( 2 1、 重复抽样条件下 总结:抽样平均误差公式 2、不重复抽样条件下 1 )1( 1 2 N nN n PP N nN n px 在 N很大的情况下, 可近似表示为: N n n PP p 1 )1( 2021年 4月 11日 31 三、抽样极限误差 抽样误差是越小越好吗? n 抽样 误差 抽样误 差小 n要求 比较大 势必增 加费用 标准: 将抽样误差控制在我 们 能承受的范围 内 抽样极 限误差 人为确定的 2021年 4月 11日 32 xXx pPp 含义和定义公式 (p193) 抽样极限误差又称允许误差, 是根据研究任务要求和被研究总体差 异程度确定的可允许的最大抽样误差范围, 一般用 表示,它等于 样本指标可允许变动的上、下限与总体指标的绝对离差。 x 平均数的抽样极限误差 p 成数的抽样极限误差 这个误差范围是 人为给定 的,是 区间估计 中为了得到一个可靠性估 计而专门设计的 的定义公式 为了理解 并引出置信区间表达式,对上述定义公式作如下的代数 变换: 2021年 4月 11日 33 定义公式的等价变换 等价变换为下列不等式: xx XxX pp PpP xXx | pPp | x的含义,是希望所抽到的样本的样本平均数 能落在 内,从而样本对总体的代 表性足够高 , xx XX p的含义,是希望所抽到的样本的样本平均数 能落在 内 , pp PP 2021年 4月 11日 34 xx xXx pp pPp 由于总体平均数和总体成数是未知的,抽样调查的目的 就是要用样本指标来估计它们,因此上述不等式进一步变 换为: 这就是我们需要的 区间估计式,即置信区间的表达形式 区间估计式 xx XxX pp PpP 2021年 4月 11日 35 与 之间的关系理解 (重点理解 ) 同一个总体中,在抽样组织方式、抽样方法、样本容 量一定的条件下, 是一个确定的数值 是人为规定的,是人们根据研究目的确定的,它的 大小与人们期望的 估计精度和估计可靠性 有关 一般用 t 倍的 来表示,通常是通过人为规定 t 来控 制 客观存在,因此人为规定 和人为规定 t或 F(t)是等 价的 2021年 4月 11日 36 概率度 t,是用 除以相应的 后得到 t本质上是标准化后的变量,标准化过程为 xx x Xx t pp p Ppt 四、概率度 t与概率 F(t) t 2021年 4月 11日 37 x ),( 2 nXNx p )1(,( n PPPNp 在 大样本 条件下,样本平均数 服从正态分布 样本成数 服从正态分布 中心极限定理证明了 xx Xxx t pp Ppp t 2021年 4月 11日 38 正态分布概率值 t与 F(t)的关系 -t t F(t) t (t) 概率 F(t),称为概率保证程度或 置信度 、可靠程度等, 用以表示样本指标与总体指标之间的误差不超过一定范围 的概率的大小 1)(2)()()( tXxPtXxPtF x x 2021年 4月 11日 39 常用概率度和概率 给定 t值,就可以查正态概率分布表得到相应的概率 t F ( t ) 0.5 38.29% 1 68.27% 1.69 90% 1.96 95% 2 95.45% 3 99.73% F(t)是 t的 单调增函 数 1)2(29545.0)2()2()2( x x Xx PXxPF 2021年 4月 11日 40 概率度 t的作用 t实际上是衡量概率 F(t)的一个尺度、标准,所 以称为 概率度 作用: 1.通过 t,建立了 与 之间的数量关系 =t 2.通过 t,也建立了区间的大小与估计把握程度 F(t)之间的关系 )()( xXxPtF )(, tFxxX xx 度为的概率保证程度或置信 2021年 4月 11日 41 5.2结束 谢谢大家!
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!