资源描述
,#,返回,8.1 引 言,前面提到的整群抽样虽然,有很多优点,但是由于群内单,元通常具有相似性(表现为群,内相关系数大于零)。尤其是,当群比较大时,人们自然会想,到没有必要对群内所有单元都,进行调查,而只要对群内单元,进行再抽样,对被抽中的单元,进行调查,这就是常用的多阶,段抽样。,一、多,阶,阶段抽,样,样的定,义,义,先在总,体,体单元,(,(初级,单,单元),中,中抽出,样,样本单,元,元,并,不,不对这,个,个样本,单,单元中,的,的所有,下,下一级,单,单元(,二,二级单,元,元)都,进,进行调,查,查,而,是,是在其,中,中再抽,出,出若干,个,个二级,单,单元并,进,进行调,查,查。,这种抽,样,样方法,称,称为二,阶,阶段抽,样,样。同,样,样的道,理,理,还,可,可以有,三,三阶段,抽,抽样、,四,四阶段,抽,抽样等,。,。对于,二,二阶段,以,以上的,抽,抽样,,统,统称,为,为多阶段,抽,抽样。,二、多,阶,阶段抽,样,样的优,点,点,(1)多阶段,抽,抽样保,持,持了整,群,群抽样,的,的样本,比,比较集,中,中、,便于调,查,查、节,约,约费用,等,等优点,。,。,(2)多阶段,抽,抽样不,需,需要编,制,制所有,小,小单元,的,的样本,框,框。,三、抽,选,选方法,与,与推断,原,原理,多阶段,抽,抽样时,,,,每一,个,个阶段,的,的抽样,可,可以相,同,同,也,可,可以不,同,同。它,通,通常与,分,分层抽,样,样、整,群,群抽样,、,、系统,抽,抽样,结合使,用,用。多,阶,阶段抽,样,样时,,抽,抽样是,分,分步进,行,行的,,因,因此,,讨论估,计,计量的,均,均值及,其,其方差,时,时,需,要,要分阶,段,段进行,这,这要,用到下,面,面的性,质,质,。,性质1对于两,阶,阶段抽,样,样,有,式中,为在固定初级单元时对第二阶抽样求均,值和方差;为对第一阶抽样求均值和方差。,性质1可以推,广,广到多,阶,阶段抽,样,样的情,形,形,例,如,如,对于三,阶,阶段抽,样,样,有,8.2初级单,元,元大小,相,相等的,二,二阶抽,样,样,第一阶,段,段在总,体,体N个初级,单,单元中,,,,以简,单,单随机,抽,抽样抽,取,取n个初级,单,单元,,第,第二阶,段,段在被,抽,抽中的,初,初级单,元,元包含,的,的M个二级,单,单元中,,,,以简,单,单随机,抽,抽样抽,取,取m个二级,单,单元,,即,即最终,接,接受调,查,查的单,元,元。,例如:,某,某个新,开,开发的,小,小区拥,有,有相同,户,户型的15个单元,的,的楼盘,,,,居民,已,已经陆,续,续搬入,新,新居,,每,每个单,元,元住有12户居民,,,,为调,查,查居民,家,家庭装,修,修情况,,,,准备,从,从180户居民,户,户中抽,取,取20户进行,调,调查。,如,如下表,:,:,编号,单 元,房 号,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,一栋A座,一栋B座,一栋C座,二栋A座,二栋B座,二栋C座,三栋A座,三栋B座,三栋C座,四栋A座,四栋B座,四栋C座,五栋A座,五栋B座,五栋C座,1,2,3 4,5 6 7 8 9,10,11 12,1 2 3 4 5 6 7 8 9 10 11 12,1 2 3 4 5 6 7 8 9 10 11 12,1 2 3 4 5 6 7 8 9 10 11 12,1 2 3 4 5 6 7 8 9 10 11 12,1,2 3 4 5,6,7 8,9,10,11,12,1 2 3 4 5 6 7 8 9 10 11 12,1 2 3 4 5 6 7 8 9 10 11 12,1 2 3 4,5,6,7 8,9,10,11 12,1 2 3 4 5 6 7 8 9 10 11 12,1 2 3 4 5 6 7 8 9 10 11 12,1 2 3 4,5,6,7 8,9 10,11,12,1 2 3,4,5,6 7,8 9 10,11,12,1 2 3 4 5 6 7 8 9 10 11 12,1 2 3 4 5 6 7 8 9 10 11 12,表中红,字,字为抽,中,中的房,号,号。,这时,,初,初级单,元,元有15个,,每,每个初,级,级单元,拥,拥有二,级,级单元,12个,。,。首先,将,将单元,从,从1到15编,号,号,在15单,元,元中随,机,机抽取,5个单,元,元,分,别,别是1,,,,6,9,12,13号;,然,然后在,被,被抽中,的,的,单元中,,,,进行,第,第二次,抽,抽样,,即,即分别,在,在12,户,户居民,户,户中随,机,机,抽取4,户,户。,一、符,号,号说明,初级单元和初级单元拥有的二级单元个数:N,M,第一阶段和第二阶段抽样的样本量:n ,m,第i个初级单元中的第j个二级单元的观测值:,样本中第i个初级单元中的第j个二级单元的观测值:,第一阶,段,段和第,二,二阶段,的,的抽样,比,比:,第i个,初,初 级,单,单,元,元 按,二级单,元,元的平,均,均 值,:,:,按二级,单,单元的,平,平均值,:,:,初级单,元,元间的,方,方差:,初级单元内的方差:,由 的表达式可知,若记,则有,即 是 的平均值。同理有,二、估,计,计量及,其,其性质,(一)总,体,体均值,的,的估计,性质2,对于初级单元大小相等的二阶抽样,如果两个阶,段都是简单随机抽样,且对每个初级单元,第二阶抽样,是相互独立进行的,则对总体均值 的无偏估计为:,其方差,为,为:,的无偏估计为:,【例8.1,】,】,欲调查4月份100家企业,的,的某项,指,指标,,首,首先,从100家企业,中,中抽取,了,了一个,有,有板有5家样本,企,企业的,简,简单随,机样本,,,,调查,人,人员对5家企业,分,分别在,调,调查月,内,内随机,抽,抽取3,天作为,调,调查日,,,,要求,样,样本企,业,业只填,写,写这3天的流,水,水帐。,调查的,结,结果如,下,下。,样 本 企 业,第一日,第二日,第三日,1,2,3,4,5,57,38,51,48,62,59,41,60,53,55,64,50,63,49,54,要求根,据,据这些,数,数据推,算,算不100家,企,企业该,指,指标的,总,总量,,并,并,给出估,计,计的95%置,信,信区间,。,。,解,将企业,作,作为初,级,级单元,,,,将每,一,一天看,着,着二级,单,单元。,调查月,内,内拥有30天,(,(即拥,有,有30,个,个二级,单,单元),。,。,首先在,初,初级单,元,元中抽,取,取一个n=5,的,的简单,随,随机样,本,本再,对每个,样,样本的,二,二级单,元,元分别,独,独立抽,取,取一个m=3,的,的简单,随机样,本,本,由题意,,,,N=100,,,,M=30,n=5,m=3,首先计算样本初级单元的均值 、方差 :,样 本 企 业,1,2,3,4,5,60,43,58,50,57,13,39,39,7,19,于是得,到,到:,置信度,为,为95%的置信,区,区间为,:,:160800,1.969216,在上面,的,的方差,估,估计式,中,中,第,一,一项是,主,主要的,,,,第二,项,项,要小得,多,多!,(二)对,总,总体比,例,例的估,计,计,如果要,估,估计总,体,体中具,有,有所研,究,究特征,的,的二级,单,单元数,占,占全,体全体,二,二级单,元,元数的,比,比例,,则,则,式中,为第i个初级单元中具有所研究特征的二级单元,数,则对P的估计为:,式中,,为,为第i,个,个初级,单,单元中,具,具有所,研,研究特,征,征的二,级,级单元,数。,性质3,对于二阶抽样,如果两个阶段都是简单随机,抽样,则有,估计量 的方差为:,的无偏估计为:,式中,,【例8.2,】,】,欲调查,某,某个新,小,小区居,民,民家庭,装,装潢聘,请,请装潢,公司的,比,比例。,我,我们在15个单元,中,中随机,抽,抽取了5个单元,,,,在,这5个单元,分,分别随,机,机抽取,了,了4户居民,进,进行调,查,查,对,这,这20户,的调查,结,结果如,下,下表:,样本单元,第一户,第二户,第三户,第四户,一栋A座,二栋C座,三栋C座,四栋C座,五栋B座,是,否,否,否,是,是,是,否,否,否,否,否,否,否,否,否,否,是,否,否,要求根,据,据这些,数,数据推,算,算居民家,庭,庭装潢,聘,聘请装,潢,潢,公司的,比,比例。,解:,记聘请装,潢,潢公司,的,的居民,户,户为“1”,否则,记,记为“0”。,这里,N=15,M=12,n=5,m=4 ,因此,,其方差,的,的估计,为,为:,P的置信区间为:,8.3初级单,元,元大小,不,不等的,二,二阶抽,样,样,一般而,言,言,初,级,级单元,的,的大小,是,是不相,等,等的,,如,如果按,初,初,级单元,的,的大小,分,分层后,,,,层内,初,初级单,元,元的大,小,小差别,仍,仍很大,,,,,则需用,本,本节介,绍,绍的方,法,法来处,理,理二阶,抽,抽样的,问,问题。,当,当初级,单元大,小,小不等,时,时,一,般,般采用,不,不等概,抽,抽样。,一、符,号,号说明,总体中,初,初级单,元,元个数,及,及第一,阶,阶抽取,的,的样本,量,量:N,,,,n,第i个初级单元中二级单元数:,第i个初级单元中第二阶抽样的样本量:,第i个初级单元中第j个二级单元的观测值:,样本中第i个初级单元中第j个二级单元的观测值:,第一阶和第二阶的抽样比:,二级单元个数:,指标总和:,第i个初级单元指标总和:,第i个,初,初级单,元,元按二,级,级单元,的,的平均,值,值:,按二级,单,单元的,平,平均值,:,:,初级单,元,元间的,方,方差:,第i个,初,初级单,元,元二级,单,单元间,的,的方差,:,:,二、估,计,计量及,其,其性质,(一)对,初,初级单,元,元进行,简,简单随,机,机抽样,如果二,阶,阶抽样,中,中每个,阶,阶段都,采,采用简,单,单随机,抽,抽样,,并,并且,每个初,级,级单元,中,中二级,单,单元的,抽,抽样是,相,相互独,立,立的,,则,则对,总体总,和,和的估,计,计可以,采,采用简,单,单估计,,,,也可,以,以考虑,采,采用,比率估,计,计。,1.简单估,计,计量对总体,总,总和的,简,简单估,计,计为:,根据性质1,不仅,可,可以证,明,明这个,估,估计量,是,是无偏,的,的,并,且它的,方,方差为,:,:,的一个无偏估计为:,式中,,2.比率估计量,由于初级单元的大小 不同,往往,造成初级单元的观测值 差异很大,使得估计量方差,的第一项很大,从而估计量的方差也就变得很大。,这时,可以考虑将初级单元的大小 作为辅助变量,,采用比率估计量对总体总和进行估计。,对总体,总,总和的,估,估计量,为,为:,这是一,个,个有偏,估,估计量,,,,但随,着,着样本,量,量的增,加,加,,其偏倚,将,将趋于,零,零。其,近,近似均,方,方误差,为,为:,的样本估计为:,式中,,(二)对,初,初级单,元,元进行,放,放回不,等,等概抽,样,样,利用第五章的方法,事先规定每个初级单元被抽中的,概率 对被抽中的初级单元,再抽取,个二级单元。,对总体总和的估计通常是构造初级单元指标总量,的无偏估计 ,然后利用第五章介绍的Hansen-Hu,Rwitz估计量对总体总量Y进行估计。,由于 是 的无偏估计,由性质1,可以证明,是Y的无偏估计。且 的方差为:,的一个无偏估计为:,注意上,述,述对第,二,二阶抽,样,样并没,有,有做出,特,特别的,规,规定,,而,而,且估计,量,量的方,差,差估计,式,式与第,二,二阶抽,样,样的方,式,式无关,。,。,在实际,工,工作中,,,,如果,初,初级单,元,元大小,不,不相等,,,,通常,人,人,们喜欢,在,在第一,阶,阶抽样,时,时按放,回,回的与,二,二级单,元,元数成,比,比例,的不等,概,概抽样,;,;第二,
展开阅读全文