z-CH9多阶段抽样-第1、2节

上传人:sx****84 文档编号:243127048 上传时间:2024-09-16 格式:PPT 页数:47 大小:525.50KB
返回 下载 相关 举报
z-CH9多阶段抽样-第1、2节_第1页
第1页 / 共47页
z-CH9多阶段抽样-第1、2节_第2页
第2页 / 共47页
z-CH9多阶段抽样-第1、2节_第3页
第3页 / 共47页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,CH9 多阶段抽样,MS:Multi-stage Sampling,(4-5课时),9/16/2024,1,MS,MS在抽选样本单元时不是一次直接从总体中抽取总体基本单元BU,而是分两个或两个以上的阶段来抽样,比如,城市住户调查中,全国范围内,调查市县,住户,(2S),全国范围内,调查市县,街道办事处,居委会住户,(MS),一阶/初级单元,Primary unit,基本单元,Base unit,二阶单元,三阶单元等,Secondary unit,9/16/2024,2,MS方法的意义,实践中,大规模的抽样调查项目往往都采用MS,MS由CL发展而来(CL是单阶段抽样向多阶段抽样的过渡),MS可以看作对样本群内的单元实施再抽样的一种方法,与CL类似:,当某阶单元大小(群规模)相等时,则该阶的抽样采用等概抽样,但是,实践中,大多数情况单元大小不等,此时,可以:,等概抽样,加权估计,不等概抽样,HH估计,构造,自加权样本,,达到,简化估计量及其方差形式,的目的,此时,估计精度也很不错,9/16/2024,3,MS中自加权样本的构造模式,第1阶,第2阶,第n阶,各阶单元大小相等,等概抽样,各阶单元大小不等,PPS抽样,等概抽样,自加权样本,各阶样本量相等,前几阶采用PPS抽样,最后一阶(针对BU)采用等概率抽样,并且,从第二阶开始,各阶单元的下层样本量都相同,9/16/2024,4,CH9内容体系,9.1 抽样方式,介绍MS的基本概念、优点及,抽样推断原理,9.2 PU大小相等的2S抽样,均值和比例估计量及其性质,两个阶段都实施等概抽样srs,9.3 PU大小不等的2S抽样,均值估计量及其性质,等概抽样,加权估计,不等概抽样,HH估计,自加权样本的构造,9.4 进一步讨论的问题,2S条件下样本容量的确定和最优配置,三阶段抽样估计,尤其是,如何构造自加权样本,9/16/2024,5,9.1 抽样方式,MS,抽样的基本概念,MS,抽样的优点,MS,抽样估计推断原理,9/16/2024,6,一、MS的基本概念,MS在抽选样本单元时并不是一次直接从总体中抽取BU,而是分两个或两个以上的阶段来进行,比如,城市住户调查中,全国范围内,调查市县住户,(2S),全国范围内,调查市县,街道办事处,居委会住户,(MS),一阶单元,Primary unit,基本单元,Base unit,二阶单元,三阶单元等,Secondary unit,阶段的多少视具体情况确定,9/16/2024,7,二、MS的优点,MS来自于对CL的校正,所以MS具备CL的优点,同时也避免了CL的缺点,(?),CL的优点:样本比较集中,便于组织抽样和调查、节约费用等;对于特殊结构的总体,CL往往效果好,CL的缺陷:由于群内单元的相似性,CL的误差通常较大;另外,若群规模较大,群内实施全面调查难以体现抽样调查的优势,MS的优点:,保持了CL样本比较集中,便于调查、节约费用等优点,同时又避免了对小单元过多调查造成的浪费,从而充分发挥抽样调查的优点,MS不需要编制所有BU的抽样框,从而可以简化抽样框的编制工作,9/16/2024,8,MS的优点,(P189),1、简化抽样框的编制工作,便于组织抽样,对范围较大、分布较广、单元数多的目标总体,实施MS,按现有的行政区划(或地理区域)划分各阶段抽样单元,从而,简化抽样框的编制,工作,便于样本单元的抽取,2、可以使抽样方式更加灵活和多样,MS中,各阶段可根据具体情况分别设计和采用,不同的抽样组织方式,(MS经常与st、cl、sy、PPS等相结合),从而充分发挥各种抽样方式的优势,同时,各阶段也可以自行采用,不同的估计方法,9/16/2024,9,MS的优点(续),3、能够提高估计精度,与CL相比,相同的n,MS的样本在总体中的分布更广,因而也更具代表性,同时,MS可以通过对方差较大的阶段设定高一点的抽样比,来进一步提高样本的代表性,从而提高抽样估计精度,4、可以提高抽样的经济效益,与CL相比,MS虽然看起来抽样过程更为复杂,但实际上操作起来非常简便(可操作性强),组织管理和实测调查的工作量也不大,因此MS的费用将更节省,经济效益更高,5、可以为各级机构提供相应的信息,MS可以满足各阶段(不同层次)的需要,这与st有些类似,比如,中国城镇居民住户调查,9/16/2024,10,三、MS抽样推断原理,(延展性内容),从理论上分析MS条件下估计量的期望和方差的基本公式,本章各种形式的估计量的无偏性的证明和方差形式的推导都是依据的这个原理,1、2S (P191-194),其中,E,2,、,V,2,固定,PU,时对第二阶抽样求均值和方差,E,1,、,V,1,对第一阶抽样求均值和方差,9/16/2024,11,两个阶段抽取的所有可能样本估计量的期望,对某一固定的第一阶段样本中,所有可能抽出的二阶样本的估计量的期望,所有可能抽出的第一阶样本的估计量的期望,9/16/2024,12,举例说明,总体包含3个PU,每个PU包含2个BU,现:第一阶段srs抽取2个PU,第二阶段从每个抽中的PU中srs抽取1个BU,比如,总体分3个学习小组,每个学习小组包括2名同学。现在先srs抽2个学习小组,再从抽中的学习小组中抽1名同学,进行某项成绩测试,所有可能的样本共,C,3,2,C,2,1,C,2,1,=12个,求这12个样本的估计量的数学期望,9/16/2024,13,可能的抽样结果,PU,A,B,C,BU,(a,b),(c,d),(e,f),2个,1个,PU,(A,B),(B,C),(A,C),(a,c),(a,d),(b,c),(b,d),BU,(c,e),(c,f),(d,e),(d,f),(a,e),(a,f),(b,e),(b,f),总体,9/16/2024,14,定性理解:两个阶段的随机抽样均可能带来抽样误差,2S的方差由两部分构成:一部分是第一阶段的方差V,1,;另一部分是第二阶段方差的均值,9/16/2024,15,说明,这不仅是2S抽样的估计推断原理,而是所有,两步抽样,的估计推断原理,比如,二重抽样、再抽样等方法都遵循这一原理,9/16/2024,16,2、MS,以上关于2S的估计推断原理可以推广至MS,比如,3S,9/16/2024,17,9.1的重点,掌握:,MS的基本概念,MS的优点,理解:,2S与st和CL的关系,2S的估计推断原理的理解,9/16/2024,18,2S与CL和st的关系(开拓思路),共同特点:都是首先将总体分为若干的群(或初级单位),区别,抽样方式不同,抽样误差的来源不同,9/16/2024,19,2S与CL和st的关系(续),2S来源于对CL的校正,在CL中,如果抽中群所含的次级单元数很多,此时对群内所有单元一一进行调查难度较大;尤其当群内单元标志值差别不大时,没必要这样做。这时,从中选群包含的BU中抽部分进行调查,就形成了2S,CL是一种特殊的2S,第一阶段抽部分PU,第二阶段是100%抽样,其误差来源于第一阶段:群间方差,st是一种特殊的2S,第一阶段100%抽PU(层),第二阶段抽层内的部分单元,其误差来源于第二阶段:层内方差,MS是st和CL的结合物,两个阶段都是抽取部分单元,都会产生误差,9/16/2024,20,三种抽样方法的比较,组织,形式,PU,BU,精度,(n相同时),提高精度,的办法,st,抽全部,抽部分,高于srs,缩小层内差异,扩大层间差异,CL,抽部分,抽全部,低于srs,缩小群间差异,扩大群内差异,增加群数,2S,抽部分,抽部分,介于CL和srs间,减少PU间的差异,尽量多抽PU,9.1结束,9/16/2024,21,9.2 PU大小相等的二阶段抽样,一、符号说明,二、均值估计量及其性质,三、比例估计量及其性质,9/16/2024,22,意义,PU大小相等指的是:总体中所有的PU中包含的二级单元数(BU数)都相等,PU大小严格相等的情况实践中很少见,但是对它的讨论是MS的基础,同时也具有现实意义,主要体现在:,1、有时,PU规模差异不明显,可近似为PU大小相等,2、有时,对于PU大小不等的情况,可通过分层,将大小近似的PU分到一层,则层内的2S就可以按PU大小相等的情况讨论,所以,本节的讨论很有理论和实践意义,9/16/2024,23,讨论的前提,A个PU,srs,a个PU,M个BU,M个BU,M个BU,srs,m个BU,m个BU,m个BU,每个PU相互独立地抽取等容量的BU数,总体单元数=AM,样本单元数=am,9/16/2024,24,一、符号说明,两个抽样比,两个层次的均值,两个方差,9/16/2024,25,基本符号,(Y,ij,,i=1,2,A; j=1,2,M) (y,ij,,i=1,2,a; j=1,2,m),9/16/2024,26,二、均值估计量及其性质,9/16/2024,27,均值估计量及其性质的基本结论,是无偏估计,第一阶抽样误差,是误差的主要组成部分,am一定时,提高a而减少m会有效提高估计的精度,9/16/2024,28,无偏性的证明,对称性论证法,9/16/2024,29,方差形式的证明,(P192 9.4-,9.10,),看作一个变量,9/16/2024,30,方差形式的证明,对称性论证法,各PU独立抽取,9/16/2024,31,方差的无偏估计的证明,(P193,9.11,-9.18),两个关键的结论:,9/16/2024,32,例9.1说明,(P194,,典型例题,),根据题意判断其抽样方法PU大小相等的2S,解题的基本思路:区间估计的三要素,总体总值的估计,9/16/2024,33,注意,1、方差估计式中,第一项是主要的,第二项要小很多,这是因为第二项的分母是第一项的m倍,而且分子上还要乘以小于1的f,1,。,所以,在am一定时,提高a而减少m会有效地提高估计的精度,2、如果第一阶的抽样比f,1,可以忽略,则可以简化方差的估计式,9/16/2024,34,这个结果在实践中可作为参考,因为第二阶抽样采用,Sy,或其他复杂抽样方法时,很难得到,S,2,2,的无偏估计,如果,f,1,可以忽略,只需要,PU,的样本均值就可得到方差的近似估计,但从另一方面说,,f,1,可忽略,意味着总体中,PU,数,A,很大,而抽选出的,a,却很小,(am,一定的情况下相当于,m,比较大,),,结果是样本分布相对集中,势必增大抽样误差,(,类似于,CL),这是一对矛盾,应权衡处理,9/16/2024,35,补例,研究目的:某省有100个县,每县有200个村,现欲通过两阶段抽样估计粮食平均亩产,抽样方法及样本结果:第一阶段抽取4个县(A,B,C,D)。第二阶段从每县中抽取5个村(1,2,3,4,5),一共是20个样本村,通过调查取得粮食平均亩产资料如下表,9/16/2024,36,表 20个村平均粮食亩产资料,单位:斤,要求:用样本资料推断全省粮食平均亩产及其置信区间,(,置信度为,95%),。,9/16/2024,37,三、总体比例的2S估计量及其性质,掌握的关键:,比例,P,与均值的对应关系,尤其是字母符号的对应关系,9/16/2024,38,比例估计和均值估计之间字母符号的对应关系,设,T,i,总体第i个PU中具有某特征的BU数,t,i,样本第i个PU中具有某特征的BU数,P,i,总体第i个PU的比例,p,i,样本第i个PU的比例,9/16/2024,39,很重要的一个关系,9/16/2024,40,比例估计量及其无偏性,(P196 9.21),是无偏估计,也是无偏估计,9/16/2024,41,比例估计量的方差,(P196 9.22-9.24),9/16/2024,42,方差的无偏估计,(P196 9.25),Aa,,,Mm,,,P,p,,,Q,q,,,第二项再乘以,f,1,9/16/2024,43,P196例9.2说明,(,典型例题,),9/16/2024,44,补例,研究目的:,某林场有160块地,每块地有9棵树,现发现了某种病害,欲检查病树所占比例,抽样方法及结果:,用2S抽样,先从林场抽取了40块样地,每块样地中又抽3棵树,检查结果发现有22块地的3棵树均没有病,11块地有1棵树有病,4块地有2棵树有病,3块地3棵树全有病,要求:,估计病树的比例及其估计方差,9/16/2024,45,9.2总结,假设前提的理解,典型例题的掌握:【9.1】,【9.2】,比例估计与均值估计的核心,9.2是本章计算的重点之一,9/16/2024,46,作业,思考:P203 9.1、9.2,作业:P203 9.3、9.4,9.2结束,9/16/2024,47,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!