第四章(多阶段抽样)

上传人:1505****484 文档编号:240717283 上传时间:2024-05-02 格式:PPT 页数:37 大小:799.50KB
返回 下载 相关 举报
第四章(多阶段抽样)_第1页
第1页 / 共37页
第四章(多阶段抽样)_第2页
第2页 / 共37页
第四章(多阶段抽样)_第3页
第3页 / 共37页
点击查看更多>>
资源描述
第四章第四章(多阶段抽样多阶段抽样)问题的提出v在在整整群群抽抽样样中中,如如果果抽抽中中的的群群内内所所含含的的次次级级单单元元个个数数相相当当多多,此此时时对对该该群群作作普普查查会会感感到到“心心有有余而力不足余而力不足”。v当当群群内内的的次次级级单单元元差差异异不不大大时时,对对群群内内所所有有的的次级单元一一访问似乎完全没有必要。次级单元一一访问似乎完全没有必要。v何不在抽中的群内再作一定方式的抽样呢?何不在抽中的群内再作一定方式的抽样呢?多阶段抽样的概念在总体各单位(初级单位)中抽取样本单位,在在总体各单位(初级单位)中抽取样本单位,在抽中的初级单位中再抽取若干个第二级单位抽中的初级单位中再抽取若干个第二级单位(SecondarySamplingUnits),在抽中的第),在抽中的第二级单位中再抽取若干个第三级单位(二级单位中再抽取若干个第三级单位(TertiarySamplingUnits),直至从最后一级单位,直至从最后一级单位中抽取所要调查的基本单位的抽样组织形式,就中抽取所要调查的基本单位的抽样组织形式,就叫做多阶段抽样。叫做多阶段抽样。最简单的是两阶段抽样,即在整群抽样的基础上,最简单的是两阶段抽样,即在整群抽样的基础上,对抽中的群不是全面调查,而是只抽取部分单位对抽中的群不是全面调查,而是只抽取部分单位进行调查。进行调查。共同点:都将总体分为若干共同点:都将总体分为若干子总体子总体(层、群)(层、群)分层抽样分层抽样对总体中每个子总体(层)都进行抽样;对总体中每个子总体(层)都进行抽样;区别区别整群抽样整群抽样对总体中被抽中的若干个子总体(群)对总体中被抽中的若干个子总体(群)进行普查;进行普查;二阶抽样二阶抽样对总体中被抽中的若干个子总体(群)对总体中被抽中的若干个子总体(群)再进行抽样。再进行抽样。分层抽样、整群抽样、二阶抽样的共同点及区别分层抽样、整群抽样、二阶抽样的共同点及区别阶段抽样的特点(一)便于组织抽样。(一)便于组织抽样。(二)可以使抽样方式更加灵活和多样化。(二)可以使抽样方式更加灵活和多样化。(三)能够提高估计精度。(三)能够提高估计精度。(四)可以提高抽样的经济效益。(四)可以提高抽样的经济效益。(五)可以为各级机构提供相应的信息。(五)可以为各级机构提供相应的信息。两阶段抽样的研究,是多阶段抽样研究的基两阶段抽样的研究,是多阶段抽样研究的基础和出发点。多阶段抽样的性质和特点,在二阶础和出发点。多阶段抽样的性质和特点,在二阶段抽样中都已经体现出来段抽样中都已经体现出来。1 初级单元大小相等的二阶抽样 基本假定q初初级级单单元元中中所所包包含含的的次次级级单单元元数数目目相相同同,均均为为M,因因此此从从抽抽中中的的初初级级单单元元中中再再抽抽取取的的次次级级单单元元个个数数也也相同,为相同,为m;q两个阶段的抽样方法都是简单随机抽样;两个阶段的抽样方法都是简单随机抽样;q在在抽抽中中的的初初级级单单元元中中作作第第二二阶阶抽抽样样是是相相互互独独立立进进行行的。的。相关符号和说明12N12n估计量及其性质每个阶段都是简单随机抽样每个阶段都是简单随机抽样简单随机抽样的性质简单随机抽样的性质总体均值的估计总体均值的估计 在初级单位大小相等的两阶段抽样中,在初级单位大小相等的两阶段抽样中,总体均值的无偏估计量就是二级段抽样的总体均值的无偏估计量就是二级段抽样的样本均值,即:样本均值,即:(1)的无偏估计;(2)分析 的期望就是第i个小盒子的均值 ,再对 求期望,相当于 中简单随机样本均值的期望,即为大盒子(总体)均值 。因此,的无偏估计。12N 注意到:是两次概率抽样的平均数,因此它的方差(平方误差)应当由两部分形成:一部分取决于第一阶抽样的样本量n与初级单元间的方差,即为 ;另一部分取决于第二阶抽样的总样本量mn与初级单元内的方差,即为 ,因此:的无偏估计是:注意:为什么注意:为什么的形式不完全相同?的形式不完全相同?这是因为:的无偏估计,因为 ,在 中带有个小盒子的方差的缘故。关于估计量方差的证明关于估计量方差的证明定理定理1.对于两阶段抽样,有对于两阶段抽样,有证明:证明:只对方差做证明:只对方差做证明:定理定理2.对于两阶段抽样,有以下三个性质。对于两阶段抽样,有以下三个性质。性质一性质一证明:性质二性质二证明:证明:性质三:性质三:例例1新华书店某柜台上月共用去发票70本,每本100张。现随机从中挑出10本,每本中随机抽出15张发票,得到数据如下:求(1)估计上月该柜台的营业总额;(2)估计以上估计值的方差;(3)给出上月该柜台的营业总额置信度为95%的置信区间。i12345678910372.25408.30323.40502.50234.00387.75284.20256.60314.10280.5011280.2512115.998752.7617833.753953.0011302.506573.044822.366921.015827.25解:解:(1)已知条件为:N=70,n=10,M=100,m=15,f1=1/7,f2=0.15 故 故 故上月该柜台的营业总额的估计值为157108.00元。(2)要求方差,需先计算 。i1234567891025.0227.2221.5633.5015.6025.8518.9517.1120.9418.70135.0271.58127.1671.4321.6197.3784.7530.7924.5541.56可以算得:因而 的方差的估计为:(3)因此,的标准误差的估计为:因而,绝对误差限 这样我们就得到上月该柜台的营业总额的置信度为95%的置信区间为:(157108.00-22165.35,157108.00+22165.35)【例【例2】欲调查】欲调查4月份月份100家企业的某项指标,家企业的某项指标,首先从首先从100家企业中抽取了一个含有家企业中抽取了一个含有5家样家样本企业的简单随机样本,由于填报一个月本企业的简单随机样本,由于填报一个月的数据需要每月填写流水帐,为了减轻样的数据需要每月填写流水帐,为了减轻样本企业的负担,调查人员对这本企业的负担,调查人员对这5家企业分别家企业分别在调查月内随机抽取在调查月内随机抽取3天作为调查日,要求天作为调查日,要求样本企业只填写这样本企业只填写这3天的流水帐。调查的结天的流水帐。调查的结果如表果如表8.2所示。所示。表表8.2对5家企家企业的的调查结果果样本企业第一日第二日 第三日15759642384150351606344853495625554要求根据这些数据推算要求根据这些数据推算100家企业该指标的总量,并家企业该指标的总量,并给出估计的给出估计的95置信区间。置信区间。解:对这个问题,我们可以利用两阶段的思路解决。解:对这个问题,我们可以利用两阶段的思路解决。首先将企业作为初级单位,将每一天看作二级单位,首先将企业作为初级单位,将每一天看作二级单位,每个企业在调查月内都拥有每个企业在调查月内都拥有30天(即拥有天(即拥有30个二级单位)。个二级单位)。调查人员首先在初级单位中抽取了一个调查人员首先在初级单位中抽取了一个n5的简单随机样本,的简单随机样本,然后对每个样本的二级单位分别独立抽取了一个然后对每个样本的二级单位分别独立抽取了一个m3的的简单随机样本,这就是初级单位大小相等的两阶段问题。简单随机样本,这就是初级单位大小相等的两阶段问题。由题意,由题意,N100,M30,n5,m3 在置信度在置信度9595的条件下,的条件下,对应的的t t1.961.96,因此,置信区,因此,置信区间为:60800608009216.00789216.0078,或者说在,或者说在142736.6142736.6178863.4178863.4之间。之间。在方差估计的时候,第一项是主要的,第二项要小的多,因为第二项的分母是第一项的m倍,而且还要乘以小于1的数f1。因此当第一阶抽样比相当小,可以忽略的时候,方差估计式可以从简化为这个结果在实际工作中可以作为参考。结束语结束语谢谢大家聆听!谢谢大家聆听!37
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!