抽样调查理论与方法-金勇进(第二版)-第2章-简单随机抽样课件

上传人:沈*** 文档编号:241398474 上传时间:2024-06-23 格式:PPT 页数:52 大小:865.51KB
返回 下载 相关 举报
抽样调查理论与方法-金勇进(第二版)-第2章-简单随机抽样课件_第1页
第1页 / 共52页
抽样调查理论与方法-金勇进(第二版)-第2章-简单随机抽样课件_第2页
第2页 / 共52页
抽样调查理论与方法-金勇进(第二版)-第2章-简单随机抽样课件_第3页
第3页 / 共52页
点击查看更多>>
资源描述
第第2章章简单随机抽样(简单随机抽样(SRS)2.1定义与符号定义与符号n简单随机抽样也称为纯随机抽样。n从含有 N 个单元的总体中抽取 n 个单元组成样本,如果抽样是不放回的,则所有可能的样本有 个,若每个样本被抽中的概率相同,都为 ,这种抽样方法就是简单随机抽样。n称 为抽样比,记为 f。抽样总体样本容量【例例2.1】n设总体有5个单元(1、2、3、4、5),按不放回简单随机抽样的方式抽取2个单元,则所有可能的样本为个:1,22,33,44,51,32,43,51,42,51,5【例例2.2】n设总体有5个单元(1、2、3、4、5),按放回简单随机抽样的方式抽取2个单元,则所有可能的样本为25个(考虑样本单元的顺序):1,12,13,14,15,11,22,23,24,25,21,32,33,34,35,31,42,43,44,45,41,52,53,54,55,5简单随机抽样的抽取规则n(1)按随机随机原则取样;n(2)每个抽样单元被抽中的概率都是已知已知的的或事先确定的;n(3)每个抽样单元被抽中的概率都是相等相等的的。(等概随机抽样)n定义定义2.1 从总体的N个单元中,一次整批抽取n个单元,使任何一个单元被抽中的概率都相等,任何n个不同单元组成的组合被抽中的概率也都相等,这种抽样称为简单随机抽样。n定义定义2.2 从总体的N个单元中,逐个不放回地抽取单元,每次抽取到尚未入样的任何一个单元的概率都相等,直到抽足n个单元为止,这样所得的n个单元组成一个简单随机样本。n定义定义2.3 按照从总体的N个单元中抽取n个单元的所有可能不同的组合构造所有可能的 个样本,从 个样本随机抽取1个样本,使每个样本被抽到的概率都等于 ,这种抽样称为简单随机抽样。符号 n大写符号表示总体的标志值,n用小写符号表示样本的标志值 总 体样 本 简单估计量总体指标值上面带符号“”的表示由样本得到的总体指标的估计。2.2 简单估计量及其性质简单估计量及其性质n引理引理 2.2.1 1:从大小为N的总体中抽取一个样本量为n的简单随机样本,则总体中每个特定单元入样的概率为n/N,两个特定单元都入样的概率为:n引理引理2.2 2.2 从总体规模为N的总体中抽取一个样本量为n的简单随机样本,若对总体中的每个单元 ,引进随机变量 (入样,;不入样,),则 n定理定理 2.2.1 1:对于简单随机抽样,作为 的简单估计,是无偏的,即 始终成立。n推推论 2.2.1 1:对于简单随机抽样,的期望为:n推推论 2.22.2:对于简单随机抽样,的期望为:n推推论 2.32.3:对于简单随机抽样,n较大时,的期望为:n对于有限总体的方差定义:n定理定理2.2:对于简单随机抽样,的方差其中,称为有限总体校正系数。(未入样率)评价调查成功评价调查成功与否的重要指标与否的重要指标n估计量的方差 是衡量估计量精度的度量。影响估计量方差的因素主要是样本量n n n n,未入样率未入样率未入样率未入样率 1-f1-f1-f1-f和总体方差和总体方差和总体方差和总体方差 。在简单随机抽样的条件下,只有通过加大 样本量来提高估计量的精度。n推推论 2.42.4:对于简单随机抽样,的方差为:n推推论 2.52.5:对于简单随机抽样,的方差为:n推推论 2.62.6:对于简单随机抽样,当n较大时,的方差为:n定理定理 2.32.3:对于简单随机抽样,有 式中,为总体协方差。协方差定义:n定理定理 2.42.4:简单随机抽样的方差 是总体方差 的无偏估计。n推推论 2.72.7:对于简单随机抽样,是 的无偏估计。n推推论 2.82.8:是 的无偏估计。n推论推论 2.9:对于简单随机抽样,n推论推论 2.10:对于简单随机抽样,当n较大时,有n大样本下,抽样调查样本均值的估计量近似服从正态分布,【例例2.32.3】n我们从某个N=100的总体中抽出一个大小为n=10的简单随机样本,请估计总体平均水平,并给出置信度为95%的区间估计。序号1234567891045204661508n由置信度95%对应的 ,因此,可以以95%的把握说总体平均水平大约在 之间,即2.4295和7.5705之间。n定理定理 2.52.5:简单随机抽样的协方差 是总体协方差 的无偏估计。n主要变量 Y n与Y有关的辅助变量 Xn辅助变量必须与主要变量高度相关n辅助变量与主要变量之间的相关关系整体上相当稳定n辅助变量的总体总值或总体均值必须是已知的,或是容易获得的n辅助变量的信息质量更好,或信息更容易取得即调查成本更低。2.3 比率估计量及其性质比率估计量及其性质比率估计量一般用来估计主要变量的总体总值和总体均值n比率估计、回归估计需要有足够的样本量足够的样本量才能保证估计的有效性。n有偏估计:当样本量足够大时,估计的偏倚趋于0。符号定义 属于简单估计量,不属于比率估计量。总体均值的比率估计量:总体总值的比率估计量:n引理引理 2.32.3:对于简单随机抽样,n较大时,的期望为:(1)不是无偏的;(2)但在某种条件下,是近似无偏的。n定理定理 2.62.6:对于简单随机抽样,n较大时,的期望为:n推推论 2.112.11:对于简单随机抽样,n较大时,的期望为:n引理引理2.4 2.4:对于简单随机抽样,n较大时,的方差为:n定理定理 2.72.7:对于简单随机抽样,n较大时,的方差为:n推推论 2.122.12:对于简单随机抽样,n较大时,的方差为:设:是Y和X的总体相关系数Y的相对方差(变异系数)Y与X的相对协方差X的相对方差(变异系数)比率估计量的方差估计【例例2.2.4 4】n在20世纪90年代初的一项工资研究中,人们发现IT行业中,从业者的现薪与起薪之间相关系数 高达0.88,已知某IT企业474名员工的平均起薪为17016.00/年,现根据对100个简单随机抽样方式选出的员工现薪的调查结果,估计该企业员工的现薪平均水平。【例例2.2.5 5】n根据例【2.4】的数据和结果,比较两种思路下对应的方差估计结果。n间接估计n主要变量 Y n与Y有关的辅助变量 Xn辅助变量必须与主要变量高度相关n辅助变量与主要变量之间的相关关系整体上相当稳定n辅助变量的总体总值必须是已知的,或是容易获得的n辅助变量的信息质量更好,帮忙而不添乱。2.4 回归估计量及其性质回归估计量及其性质最早使用回归估计的人物之一是沃森(Watson),1937年他利用植物叶片的重量植物叶片的重量作为辅助变量,通过回归估计,得到了主要变量植物叶片面积植物叶片面积的总体均值估计。植物叶片面积与植物叶片重量之间存在稳定的线性关系。植物叶片重量比植物叶片面积更容易测定。符号定义总体均值的回归估计量:总体总值的回归估计量:回归系数未知(用样本数据估计)已知(源于往期的调查结果)n定理定理 2.82.8:对于简单随机抽样,如 为常数(记为 ),则有n定理定理 2.92.9:使回归估计的精度最高,即 最小的 为:n此时,最小值 为:n定理定理 2.102.10:对于简单随机抽样,n足够大时,的数学期望为(未知):n定理定理 2.112.11:对于简单随机抽样,n足够大时,的方差为(未知):2.4.3 各种估计量的精度比较n简单估计n比率估计n回归估计N N足足够大的情形大的情形N N不不够大的情形大的情形l 比率估计和回归估计不一定比简单估计好;l 回归估计的抽样误差与比率估计的相差不大,但均方误差 明显比比率估计的大,且且n n越小,回越小,回归估估计的均方的均方误差越大差越大。n2.5.1 样本容量的确定n由n所以,2.5 简单随机抽样的实施简单随机抽样的实施n定义 绝对误差限度:差限度:n由n所以,所以,有效回答率:有效回答人数占全部访问人数的比例 所以,有效回答率:有效回答人数占全部访问人数的比例样本量的确定步骤(1)(1)根据委托机构要求确定估计精度水平n绝对误差限度n置信度(2)按照保守原则(即样本量宁大勿小),对总体方差 进行预估n利用先前的调查结果和经验n利用预调查或试调查的结果n利用同类或类似二手数据的结果n利用某些既有的结论。n由富有经验的专家指定。样本量的确定步骤(2)(3)根据给定的估计精度水平和总体方差的预估结果,同时考虑总体规模N的大小,以简单随机抽样方式及回答率为100%为前提计算出初始样本量(4)确定抽样方式,并根据设计效应对样本量进行调整:设计效应设计效应deffdeff定义:复杂抽样的样本估计量的方差与简单随机抽样的样本估计量的方差的比率。简单随机抽样简单估计量的方差 某个抽样设计在同样样本量条件下估计量的方差。Deff的作用:(1)评价抽样设计的一个依据,如果deff1,则抽样设计比简单随机抽样的效率低。(2)计算样本量如多阶段抽样的 Deff大约在22.5之间。n=n(deff)n为简单随机抽样所需样本量。样本量的确定步骤(3)(5)判断有效回答率,并进行调整(6)存在分组数据时,分别估计各组所需样本量(7)仔细权衡费用、时间、调查机构拥有或可动用的各种资源的限制最终确定样本量。(7)【例例2.52.5】n某超市新开张一段时间之后,为改进销售服务环境,欲调查附近几个小区居民到该超市购物的满意度,该超市与附近几个小区的居委会取得联系,在总体中按简单随机抽样抽取了一个n=200人的样本,调查发现对该超市购物环境表示满意或基本满意的居民有130位,要估计对该超市购物环境持肯定态度居民的比例,并在置信度95%下,给出估计的近似置信区间、绝对误差极限。(忽略抽样比的影响,f=0)n95%近似置信区间为 58.37%,71.63%end
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!