资源描述
*,*,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第二章 根本抽样方法,根本抽样技术是指调查研究中,设计抽样方案所依赖的一些根本设计要素。具体说来,这些根本抽样技术包括抽样框的制定、一阶段抽样、多阶段抽样、估计抽样误差和确定样本规模。,第一节 调查总体与抽样框,抽样一般包括以下几个步骤:,确定总体population,抽样框sampling frame,制定抽样方案,实际抽取样本,评估样本质量。,第二节 一阶段抽样,在抽样中,如果样本是一次直接从抽样框中抽出的,那么称之为一阶段抽样。它是最根本的抽样方法,其他形式的抽样方法都是在此根底上开展出来的。,一、简单随机抽样,简单随机抽样simple random sampling也称纯随机抽样,是严格按照随机原那么从含有N个单位的总体中抽取n个单位组成样本Nn,在抽样过程中总体的每个单位都有同等的时机入选样本,而且每个单位的抽取都是相互独立的。,主要方法:,抽签法,随机数法,二、系统抽样,实际抽样中经常采用的是系统抽样systematic sampling,又称机械抽样,即将N个总体单位按一定顺序排列,然后先随机抽取一个单位作为起始单位,再按某种确定的规那么抽取其他n-1个样本单位。,一整数抽样间距,二非整数抽样间距,三总体单位的排列,三、分层抽样,分层抽样stratified sampling也称类型抽样,是先将总体N个单位,按某种特征划分成假设干个子总体,称为层,然后在每个层中分别独立地进行抽样,最后,将抽出的子样本合起来构成总体的样本。,一样本量在各层的分配,最常见的样本量分配方式是按比例分配proportional allocation,即各层的子样本单位在总样本中所占的比例,与各层单位在总体中所占的比例完全相同。,二层的划分,理论上,按调查目标变量进行分层是最好的,但在调查之前目标变量的值是不知道的,因此只能是根据与目标变量最相关的辅助变量进行分层,常用的辅助变量包括性别、年龄、职业、教育程度、收入、地域、民族和宗教等。,三分层抽取样本的方法,在分层抽样中,有两种常见的样本抽取方法。,一种方法是先将所有总体元素按分层变量进行分层,并计算各层在总体中的比例。接着如果采用等比例分层抽样,那么直接将总体比例视为样本比例;如果采用不等比例分层抽样,那么需要对样本比例做一定的调整。最后,再按确定的样本比例,用简单随机或系统抽样方法,抽出适量的样本元素。,另一种方法适用于等比例分层抽样。先将所有总体元素按分层变量进行分层,然后将各层的总体元素一层一层连续排列,最后对连续排列的总体元素进行等距抽样。,四、整群抽样,整群抽样c1uster sampling是先将总体划分成假设干个群视为初级单位,每个群包含假设干个次级单位,然后以一定方式从总体中抽取一局部群,并由中选群中的所有次级单位构成总体的样本。,一群的性质,群的划分可以遵循以下原那么:群内方差尽可能大,群间方差尽可能小,即群内各单位的差异尽可能大,群与群之间的差异尽可能小。这个原那么与分层原那么恰好相反,简言之,异质的群,同质的层。,二规模不等的群,为了保证样本单位满足等概率原那么,可以采取相应措施来控制样本规模的变动。一方面可以按群的大小进行分层,然后对各个层使用相同的抽样比。,第三节 多阶段抽样,一、按规模分层抽样,在多阶段抽样中,最初从总体中抽出的群被称为初级抽样单位primary sampling unit,PSU,如果PSU的规模相等,用简单随机抽样或等距抽样方法,直接进行第二阶段的抽样,这时第二级单位是等概率入样的,而且样本规模是常数。这个原那么也适用于更多阶段的抽样。,二、PPS抽样,在PPS抽样中,第一阶段抽样即抽取PSU的阶段,要先放弃等概率抽样条件,采用“概率与规模成比例probability proportional to size,PPS的方法,即赋予规模不等的群与其规模或辅助变量成比例的入样概率。,这样一来,规模大的群以大概率入样,规模小的群以小概率入样。由于抽取PSU的过程是不等概率抽样,因此如果要保证总抽样比不变,就需要以一个固定的样本规模从抽中的PSU内抽取样本单位。,因为如果抽取的单位规模对每个PSU都一样,那单位入样的概率就会与群的规模成反比。这样大概率抽取群,小概率抽取样本单位,一大一小相互抵消,就保证了总体单位抽取的等概率性。与此同时,由于不管PSU大小,都抽取固定规模的样本单位,于是也控制了样本规模的变动。,三、规模测量值,进行PPS抽样的一个前提条件是要在具体抽样前,知道各级抽样单位的规模。可是在抽样前一般无法确切知道抽样单位的实际规模,为了能使用PPS方法,只能代之以各级抽样单位规模的估计值M,称为规模测量值measure of size。估计值可以从离调查时点最近的一次普查资料或其他统计资料中查找到。,第四节 抽样误差与样本规模,实际抽样中,影响样本代表性的有两类误差:抽样误差和非抽样误差。其中抽样误差是一种随机误差。,抽样中的随机误差并非都是抽样误差,有些可能是由于调查人员的失误引起的非抽样误差。它是由于样本范围与总体范围的差异而引起的误差,无论抽样设计多么精致,都会产生抽样误差。不过在概率抽样中,抽样误差是可以估算出来的。,一、简单随机抽样的抽样误差,放回简单随机抽样,不放回简单随机抽样,标准误差的意义,二、简单随机抽样的样本规模,样本规模又称样本容量,是指样本中所包含元素的数量。样本规模一方面会影响到样本的代表性,另一方面,那么直接影响到调查本钱的大小。太小的样本其代表性可能较差,但太大的样本又会增加不必要的本钱。因此,在实际抽样中,选择适宜的样本规模是非常重要的。,一影响样本规模的因素,首先,抽样精度是指抽样中希望到达的精确度,其实就是能够容忍的抽样误差e。,其次,总体标准差是反映总体元素间异质性程度的指标,一般说来,在给定抽样精度后,总体异质性程度越小,所需样本规模也越小,反之亦然。,
展开阅读全文