抽样技术课件

上传人:痛*** 文档编号:241398343 上传时间:2024-06-23 格式:PPT 页数:75 大小:837.50KB
返回 下载 相关 举报
抽样技术课件_第1页
第1页 / 共75页
抽样技术课件_第2页
第2页 / 共75页
抽样技术课件_第3页
第3页 / 共75页
点击查看更多>>
资源描述
抽样技术与方法抽样技术与方法学分:2 课时 10:0011:30教科书:抽样:理论与应用(高教出版社)参考书:抽样:设计与分析 60元主要问题:学生不同的知识背景处理:前快后慢学习方式:讲授与讨论考试方式:平时30%,期末考试70%第一章第一章 基本概念基本概念调查步骤调查步骤一个完整的调查包括几个阶段性的工作。1.调查目标确定 属于调查策划。明确通过调查所要获取的信息,确定调查内容,决定 向谁进行调查(确定调查对象)2.调查问卷设计3.抽样设计4.调查方式(数据收集)确定5.数据编码与录入6.数据审核与插补7.数据估计(包括权数确定,计算置信区间)8.调查结果表述(调查报告)抽样设计中涉及一些概念一、一、总体与样本总体与样本1.总体总体2.样本样本样本:集合的概念(与总体对应)样本单元:样本中的基础元素(与总体单元对应)初级单元,二级单元,最终单元样本量:样本单元的数量(与总体规模对应)二、目标总体与抽样总体二、目标总体与抽样总体1.目标总体目标总体2.抽样总体抽样总体3.抽样框抽样框良好抽样框的标志良好抽样框的标志 三、概率抽样与非概率抽样三、概率抽样与非概率抽样1.概率抽样概率抽样特点与作用特点与作用2.非概率抽样非概率抽样(1)方便选样)方便选样(2)目的选样)目的选样(3)自愿样本)自愿样本(4)配额选样)配额选样特点特点四、四、等概抽样与不等概抽样等概抽样与不等概抽样1.等概抽样等概抽样2.不等概抽样不等概抽样 五、抽样误差与非抽样误差五、抽样误差与非抽样误差1.抽样误差抽样误差 可以计算可以计算 可以控制可以控制2.非抽样误差非抽样误差(1)抽样框误差)抽样框误差(2)无回答误差)无回答误差(3)计量误差)计量误差 六.有关方差的概念总体方差:总体方差:样本方差:样本方差:抽样方差(估计量方差)抽样方差(估计量方差)抽样方差估计七七、精度与费用、精度与费用 精精度度100%95%60%20%40%.费用费用第二章第二章 简单随机抽样简单随机抽样Simple Random Sampling(SRS)With replacement wrSRS Without replacement wor现实中通常以wor为主体。当总体规模 N 很大时,二者没有什么区别,但wr样本单元之间独立,构造估计量要方便一些。一.基本概念1.简单随机抽样概念:属于等概率抽样2.WOR定义 样本组合数:()=每个样本被抽中的概率:P(S)=每个单元被选入样本的概率 P(i)=Mean=二基本公式性质:(Sampling fraction 抽样比)(1-f):finite population correctionsfpc 有限总体校正系数Total proportion如果单位i具备某特征如果单位 i 不具备某特征其中SampleSizen0为重复抽样条件下的样本量 当N很大时,0,n n0,wr 与 wor 几乎没有区别。三.有关问题1 样本的抽选 *随机数字表 *计算机抽取2总体方差的预先估计 历史资料 计算样本量需要总体方差 预调查 两步抽样 两步抽样 第一步:先抽n1个单位用来估计S2,进而确定n 第二步:在抽其余的n-n1个单位第三章第三章 分层抽样分层抽样(StratifiedSampling)一.基本问题 什么是分层随机抽样?作用:可以对各层的参数进行估计,有助于提高估计精度。应用条件:各层差异较大,有进行分层的辅助信息。分层原则 层内方差尽可能小 层间方差尽可能大 应用特点:在层内可采用不同的抽样方法。二 分层抽样基本公式:均值:则:若各层方差相同,即回到简单随机抽样,分层没有作用。总量估计:比例估计:当 很大,-1若估计具有某特征的单位总数A 如估计不同年龄组智力残疾儿童的人数三三.各层中样本单位数的分配各层中样本单位数的分配1.1.不同分配方式不同分配方式 层层 常常数数分分配配 与与 成成正正比比 与与 成成正正比比 内内曼曼分分配配 1 0.2 20 100 49 60 40 2 0.3 30 100 110 90 90 3 0.5 34 100 141 150 170 n 300 300 300 300 3.86 3.11 3.09 3.00 1.常数分配,实际中采用不多;2.与成正比;3.与成正比,按比例分配,常采用4.内曼分配最优分配分配样本量时考虑费用因素费用函数式中,为抽样固定费用(1)当方差一定时使最小(2)当一定时使方差最小 分配分配样本量的准本量的准则 实际运用中的考虑实际运用中的考虑比例分配,内曼分配较多使用比例分配,内曼分配较多使用 四四.关于样本量的确定关于样本量的确定 1.1.一般公式一般公式 由由 令,令,代入上式代入上式 (1)(1)因为:因为:故故2.不同条件下一般公式的运用不同条件下一般公式的运用 在比例分配条件下将代入(1)式,得或 在内曼分配条件下在内曼分配条件下在条件下,故内曼分配样本量小于比例分配样本量 在最优分配条件下在最优分配条件下由由代入到代入到中中解得解得或或 在给定费用在给定费用 条件下条件下 比例估计下样本量的确定五.分层抽样的效率分层抽样的效率200,000800,0001,000,0004,000,0001,000,0001,800,000有几种分配方案第一种第二种第三种第四种简单随机抽样四种抽样方案各自方差四种抽样方案各自方差:分层抽样:分层抽样:简单抽样简单抽样:省略省略方案一方案一方案二方案二方案三方案三方案四方案四设计效果设计效果Deff的作用:(1)评价抽样设计的一个依据(2)经验数据的恰当应用。如多阶段抽样的Deff大约在22.5之间。n=n(deff)n为简单随机抽样所需样本量。六六.层层的构造的构造1.分几层L=6层数层数抽抽样样方方差差2.层的分点层的分点(1)建立联立方程,求方差极小化的解 (2)若总体均匀分布,可等距分层(3)累积)累积法法ID 职工人数职工人数累积累积11-1010,000100100211-202,50050150321-301,60040190 层距层距七七.事后分层事后分层 什么是事后分层什么是事后分层抽取抽取 ,调查后得到,调查后得到 和和 ,又已知又已知估计 当当 充分大时充分大时故故八、八、的情况的情况例题例题企业规模企业规模小企业小企业10,0000.88000200中企业中企业1,000 88000200大企业大企业100808000200合计合计11,10024000600调整后调整后目录抽样(目录抽样(ListSampling)的含义。)的含义。九九.多指标样本量的分配多指标样本量的分配理论上的研究1.最优分配平均法选K个指标,对每个指标计算h=1,2L 例如,某项调查分为例如,某项调查分为4层,有层,有3个关键指标,样本量个关键指标,样本量1000,数据如下:数据如下:2Chatterjee(查特吉法)最优分配为考虑实际分配对偏离,会引起方差增量,取nh使方差增量的平均值为最小。本质上仍是一种平均方法,处理结果与平均法相差甚微。3Yates(耶茨法)给所考虑的每个指标,按重要性赋予权数,同时考虑层权,方差和调查费用,经过推导可得出如下分配公式该法的思路是将每个指标估计量的方差看作为损失,考虑总的损失函数(包括方差和费用)为最小。案例分析案例分析第三章第三章 比率估计和回归估计比率估计和回归估计第一节第一节 比率估计比率估计一、基本问题一、基本问题 1.什么是比率估计不是抽样方式,而是估计方法 2.作用目标量本身就是比率利用辅助变量提高估计效率 3.应用条件 有相应辅助资料目标变量与辅助变量存在相关关系 大样本大样本二二.比率估计量比率估计量 在在srssrs条件下条件下三三 估计量及性质估计量及性质 在简单随机抽样条件下的估计量1、比率的估计、比率的估计总体比率:估计量:2总体均值总体均值 的估计的估计3、总体总量的估计、总体总量的估计 估计量性质估计量性质1有偏估计,其偏倚的阶为 ,当样本量n较大时,估计量的偏倚会趋于零,比率估计是渐进无偏,即2、,和 的方差为的估计为 或者四样本量四样本量以估计以估计R为例为例因为:解得:令 ,则有 (核心)估计 时,;估计 时,五分层下的比估计五分层下的比估计1分别比估计分别比估计分别计算各层比率 ,然后合成,估计量方差估计量方差2、联合比估计、联合比估计先按分层抽样估计方法计算 ,再采用比估计估计量方差:3、两种方法的比较、两种方法的比较分别比估计联合比估计 各层样本量大,分别比估计好;各层样本量小,联合比估计好。各层比率 相似,联合比估计好第二节第二节 回归估计回归估计 定义式 均值估计 总量估计若=0,(srs),核心是,可以事先确定,也可以用样本数据估计一一 事先确定条件下事先确定条件下 即估计量是无偏的,估计量方差为当 ,即 为总体回归系数时,方差为最小,此时,遗憾的是,这只是理论上的结果,现实中不可知,否则没有 必要抽样了。二二 未知情况下未知情况下此时,是有偏的,当样本量n充分大时,估计量的偏倚趋于零。的估计为 式中,为样本的残差方差,用符号表示为:三、差值估计三、差值估计 差值估计量(difference estimator)式中,应用背景:回归系数接近于1,或辅助变量为目标变量最近的普查结果。普查与抽样调查结合问题,抽样框,辅助信息估计量性质作为 的回归估计量,是无偏估计量。的方差为:四、分层抽样下的回归估计四、分层抽样下的回归估计类似分层抽样下的比率估计1、分别回归估计均值 总量 如果 未知,用样本回归系数 作为 的估计:此时估计量有偏,若每层样本量 都很大时,偏倚可以忽略,方差近似为:式中,2、联合比估计均值 总量 回归系数未知时,用本回归系数 作为 的估计:这时回归估计是有偏,但当总样本量n很大时,偏倚趋于零,估计量方差:的样本估计为:第三节第三节 效率比较效率比较1、比率估计与简单随机抽样比较比估计优于简单随机抽样的条件是 即2、比率估计与回归估计的比较回归估计优于比估计条件是 经变换将 代入上式整理得:当 时,二者效率相同,否则回归估计优于比估计。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!