第一节抽样调查的基本思想

上传人:张哥 文档编号:189900134 上传时间:2023-02-24 格式:DOC 页数:8 大小:33KB
返回 下载 相关 举报
第一节抽样调查的基本思想_第1页
第1页 / 共8页
第一节抽样调查的基本思想_第2页
第2页 / 共8页
第一节抽样调查的基本思想_第3页
第3页 / 共8页
点击查看更多>>
资源描述
第一节抽样调查的基本思想 在日常生活和工作中,人们经常自觉或不自觉地在应用抽样方法。例如家庭主妇在炒菜过程中往往要取一点菜,尝尝菜的咸淡如何;工厂在生产过程中以及商家在进货验收过程中常抽取一定数量的产品,检验其质量并以此判定整批产品质量的优劣;商家抽取一部分消费者,了解其消费需求及偏好等。这样的例子不胜枚举。抽样也许是市场调查最为神奇的环节:仅仅通过对部分的(甚至很小的一部分)调查,最终却可以得到有关全体的信息。 绝大多数市场调查工作的目标是获取研究总体的信息及其特征。一般来说,有两种方法可以采用:一是普查,二是抽样。普查就是调查研究总体中的每个成员的信息及其特征。普查的缺点是:费时,组织工作量大;成本较高。由于两个方面的理由采用抽样调查势在必行。一方面,市场调查的客体具有参与者众多、时间、空间跨度大的特点,要获得全面的信息既不可能也不必要。另一方面,市场调查的主体是企业或那些专业市场调查机构,人、财、物资源都是有限的,根本无力进行全面调查。一、抽样调查的概念 抽样调查也称样本调查。它是按照随机原则,从研究总体的所有单位中,抽取部分单位作为样本,然后以样本的观测或调查结果对总体的数量特征作出具有一定可靠程度和精确度的估计或推断的一种调查方法。抽样调查的理论基础是概率论,概率论中诸如中心极限定理等一系列理论,为抽样调查提供了科学的依据。 抽样调查分为概率抽样和非概率抽样两类,通常我们所说的抽样调查,如果未加限定,大多指概率抽样调查。 概率抽样调查是按照随机原则抽取样本,即在总体中抽取单位时,完全排除了人的主观因素的影响,使每一个单位都有同等的可能性被抽中。遵守随机原则,一方面可使抽出来的单位的分布情况有较大的可能性接近总体的分布状况,从而使根据样本所做出的结论对总体具有充分的代表性;另一方面,遵循随机原则,可有助于调查人员准确地计算抽样误差,并有效地加以控制,从而提高调查的精度。 非概率抽样不遵循随机原则,它是从方便出发或根据主观选择来抽取样本。非概率抽样主要依赖研究个人的经验和判断,它无法估计和控制抽样误差,无法用样本的定量资料,采用统计方法来推断总体。但非概率抽样简单易行,尤其适用于做探索性研究。 在市场调查实践中,这两类抽样方式都被经常采用。二、抽样调查的特点 与普查相比,抽样调查具有经济、及时、准确和高效等显著特点,因此成为市场调查工作中最为普遍采用的方法。抽样调查方法的特点具体表现在如下几个方面。 第一、时间短、收效快。抽样调查涉及面较小,取得调查结果比较快,能在较短的时间内获得同普查大致相同的调查效果,还可以运用抽样调查技术来检验普查及有关资料的正确性,并给予必要的修正。 第二、质量高、可信程度好。抽样调查是建立在数理统计基础之上的科学方法,只要由专门人才主持抽样调查,严格按照抽样调查的要求进行抽样,就可以确保获取的信息资料具有较好的可靠性和准确性,对那些无法或没有必要进行普查的项目具有很好的适用性。 第三、费用省、易推广。由于抽样调查把调查的对象降低到较小的程度,又能保证调查的有效性,从而可以大大地减少工作量,降低费用开支,提高经济效益。同时,由于抽样调查需较少的人力、物力,企业容易承担,容易组织。三、抽样方案的设计 抽样方案设计就是从总体抽取样本之前,预先确定抽样程序和方案,在保证所抽选的样本对总体有充分代表性的前提下,力求取得最经济、最有效的结果。(一)抽样方案设计的基本内容 如何兼顾抽样效果和所付出的代价,使之能有机结合,一直是摆在抽样方案设计者面前的一个重要问题,也是抽样方案设计的难点所在。按照国外的调查经验,在制订抽样方案时,常将相关人员找到一起,包括调查资料使用者、抽样专第三章抽样设计家和实际调查工作组织者和数据处理人员,这些人员一同交流意见,协商探讨各种问题,最后提出一个合理可行的抽样方案。抽样方案设计的基本内容如下:确定抽样调查的目的。确定调查对象(总体)的范围的抽样单位。确定抽取样本的方法。确定必要的样本量。对主要抽样指标的精度提出要求。确定总体目标量的估算方法。制订实施总体方案的办法和步骤。(二)抽样方案设计的主要程序抽样方案设计的主要程序如图31所示。 图31抽样方案设计程序 1确定调查总体 确定调查总体即明确调查的全部对象及其范围。确定调查总体是抽样调查的第一个步骤,是抽样调查的前提和基础。只有对象明确,才能有的放矢,取得真实、可靠、全面的信息资料。只有明确调查总体,才能从中进行正确的抽样,并保证抽取的样本符合要求。抽样中最基本的问题是确定目标人群或总体。首先要解决的问题是我们究竟要研究谁? 一个定义明确的总体包含以下几个方面:抽样的单位是什么?(是个人还是家庭)时限是怎么样的,即要获取的信息属于哪一段时间?空间限制如何,是哪些地区,是否限于城市,或城市的繁华街区? 2建立抽样框 抽样框是构成总体全部单元的“详细名单”,样本可由此抽选出来。街道居委名录、企业名录、 本、选民花名册和俱乐部名录等都是市场调查中常用的抽样框。不借助抽样框,研究者就难以保证以同等概率抽取样本。在没有现成名单的情况下,可由调查人员自己编制。应该注意的是,在利用现有名单作为抽样框架时,要先对该名单进行检查,避免有重复、遗漏情况的发生,以提高样本对总体的代表性。如果样本框不能完全代表所要研究的人群,那么这二者之间的差异(抽样框误差)就会影响分析结果的可靠性。这种误差是构成抽样误差的最主要来源之一。 3选择调查样本 这是在调查总体中选定具体的需对其实施调查的样本。选择调查样本,首先要确定抽样调查的方法,即确定采用概率抽样,还是非概率抽样;在总的方法确定后,要确定具体的抽样方法,例如,是分层抽样,还是整群抽样等等。其次,还要确定样本的数量和大小。在上述问题确定后,按预定的要求选择调查的样本。 4实施调查 实施调查是对选定的样本运用不同的调查方法进行逐个调查,取得第一手资料。如果被访问的样本不在或拒绝接受采访,应设法改变访问技巧,再次访问。在确实无法访问时,才能改变访问对象。对概率抽样而言,一般不允许随意改变样本或减少样本数,以保证样本资料的准确性与客观性。而对于非概率抽样,如遇原定调查对象不在或不愿接待,调查人员可以根据主观标准改变访问对象,以达到样本数为标准。 5测算结果 测算结果指用样本指标推断总体指标的结果。用样本的调查结果推断总体是调查的最后一个步骤,也是调查的目的所在。具体做法可以是按百分比推算法进行推算,也可以按平均数推算法进行推断等。第二节非概率抽样 非概率抽样是总体中每一个个体不具有被平等抽取的机会,而是根据一定主观标淮来抽选样本的抽样方法。非概率抽样的缺点是,不能计算其抽样误差,这意味着评估非概率抽样的总体质量有很大的困难。经常使用的有四类非概率抽样:方便抽样、判断抽样、配额抽样和滚雪球抽样。一、方便抽样 方便抽样又称任意抽样。样本的选取主要由调查员来决定,由被调查者主动提供信息的这种方式也可属于方便抽样。方便抽样的一些例子如下:在人户调查中,调查员选择家中有人的住户。没有认定被调查者身份的拦截式访问。利用客户的名单(名片或通讯地址)进行调查。将问卷登在宣传媒体(如刊物、报纸)上,被调查者自填后寄回。 方便抽样的最大特点是节省费用与时间,但样本的信息不适用于总体参数的推断。方便样本提供信息的主要目的是帮助调研者产生想法和认识,常在预调查中采用。二、判断抽样 判断抽样方法是凭调查人员的主观意愿、经验和知识,从总体中选择具有典型代表性的样本作为调查对象的一种抽样方法。这种方法在我国市场调查中得到了广泛的运用。 判断抽样可以有两种具体做法。一种是由专家判断选择样本,一般采用平均型或多数型的样本作为调查个体,通过对典型样本的研究,由专家来判断总体的状态。所谓“平均型”,是在调查总体中挑选代表平均水平的个体作为样本,以此作为典型样本,再推断总体。所谓“多数型”,是在调查总体中挑选占多数的个体作为样本来推断总体。另一种做法是利用统计资料判断选择样本,即利用调查总体的全面统计资料,按照一定标准选择样本。 判断抽样法具有简便、易行、及时,符合调查目的和特殊需要,可以充分利用调查样本的已知资料,被调查者配合较好,资料回收率高等优点。但是,这种方法易发生主观判断产生的抽样误差,同时由于判断抽样中各个调查个体被抽取的概率不知道,因而无法计算抽样误差和可信程度。如果调查者的经验丰富,知识面广,判断能力强,抽取的样本代表性就大,反之则小。 判断抽样法适合于在调查总体中各调查个体差异较小,调查个体比较少,选择的样本有较大代表性时采用。三、配额抽样 配额抽样是非概率抽样中最流行的一种。运用配额抽样进行抽样,要按照一定标准分配样本数额,并在规定数额内由调查人员任意抽选样本。 这种方法同分层抽样有相似的地方,都是事先对总体中所有个体按其属性、特征分类,这些属性、特征称为“控制特性”,如市场调查中的消费者的性别、年龄、收入、职业、文化程度等,然后按各个控制特性分配样本数额。但它与分层抽样又有区别,分层抽样是按随机原则在层内抽取样本,而配额抽样则是由调查人员在配额内主观判断选定样本。 配额抽样与判断抽样也有区别:一是抽取样本的方式不同。配额抽样是分别从总体的各控制特性的层次中抽取若干个样本,而判断抽样是从总体的某一层次中抽取若干个符合条件的典型样本。二是抽样要求不同。配额抽样注重“量”的分配,而判断抽样注重“质”的分配。三是抽样方法不同。配额抽样方法复杂、精密,判断抽样的方法简单、易行。 按照配额的要求不同,配额抽样可分为独立控制配额抽样和相互控制配额抽样两大类。 1独立控制配额抽样 独立控制配额抽样是根据调查总体的不同特性,对具有某个特性的调查样本分别规定单独分配数额,而不规定必须同时具有两种或两种以上特性的样本数额。因此,调查者就有比较大的自由去选择总体中的样本j例如,在某项调查中,确定样本总数为:180个,可单独选择消费者收入、年龄、性别三个标准中的一个进行抽样。按独立控制配额抽样,其各个标准样本配额比例及配额数如表31表33所示。表31按年龄分组 1829岁 40 3040 60 4155 70 56-60岁以上 30 合计 200 表32按性别分组 性别 1 人数 J I 100 女 I 100 合计 l 200表33按收入水平分组 收入水平 1 人数 高 I 36 低 I 90 合计 I 200 从以上三个分组表可以看出,对年龄、性别、收入三个控制特性分别规定了样本数额,而没有规定三者之间的关系。因此,在调查人员具体抽样时,抽选不同收入段的消费者,并不需要顾及年龄和性别标准。同样,在抽选不同年龄或性别的消费者时,也不必顾及其他两个控制特性。这种方法的优点是简单易行,调查人员的选择余地较大;缺点是调查人员可能图一时方便,选择样本过于偏向某一组别,如过多地抽选女性消费者,从而影响样本的代表性。这个缺点可通过相互控制配额抽样来弥补。 2相互控制配额抽样 相互控制配额抽样是对调查对象的各个控制特性的样本数额交叉分配,上例中如果采用相互控制配额抽样,就必须对收入、年龄、性别这三项特性同时规定样本分配数。从表34可以看出,相互控制配额抽样对每一个控制特性所需分配的样本数都做了具体规定,调查者必须按规定在总体中抽取调查个体,由于调查面较广,从而克服了独立控制配额抽样的缺点,提高了样本的代表性。 表34相互控制配额抽样分配表慕钓 高 I=b 低 合计 缈 男 女 男 女 男 女 18。29岁 3 4 7 8 9 9 40 3040岁 6 5 ll 11 13 14 60 4l。55岁 6 6 13 13 16 16 70 56岁以上 3 3 6 5 7 6 30 小计 18 18 3 37 45 45 200 合计 36 74 90 配额抽样的工作程序一般分为四个步骤: 第一步:确定控制特征。调查人员可事先根据调查的目的和客观情况,确定调查对象的控制特征,作为总体分类的划分标准,如年龄、性别、收入、文化程度等。 第二步:根据控制特征对总体分层,计算各层占调查总体的比例,确定各层之间的比例关系。 第三步:确定每层的样本数。首先确定样本总数,然后根据每层占总体的比例决定每层应抽取的数目。 第四步:配额分配,确定调查个体。在各层抽取的样本数确定后,调查人员就可在指定的样本配额限度内选择样本。四、滚雪球抽样 在滚雪球抽样中,通常采用随机方式选择一组调查对象或个体,在对他们进行调查后,根据他们所提供的信息或由他们推荐选择下一组调查对象或个体。这样,通过上一组选择下一组,像滚雪球一样一波一波地继续下去,直到调查结束。即使第一组调查个体是通过概率抽样选择出的,但是最终的样本是非概率样本。 滚雪球抽样技术的主要目的是分析调研总体中的稀有特征。例如,在劳务市场调查有关保姆问题时先访问了六名保姆,然后请她们再提供其他保姆名单,逐步扩大到近百名。通过对这些保姆的调查,对保姆的来源地、从事工作的性质、经济状况等有了比较全面的掌握。 滚雪球技术的主要优点表现在,通过对调查总体设定期望的特征,从而增强了样本个体的相似性。因此,采用这种方法所产生的抽样误差比较小,成本比较低。第三节概率抽样一、简单随机抽样 简单随机抽样是概率抽样方法中最简单的一种,它对调查总体不经过任何分组、排队,完全凭着偶然的机会从中抽取个体加以调查。这种方法一般适应调查总体中各个体之问差异较小的情况,或者调查对象不明,难以分组、分类时的情况。如果市场调查范围较大,总体内部各个体之间的差异程度较大,则要同其他概率抽样结合使用。 1简单随机抽样常用的方法 1)抽签法。用抽签法抽取样本,先将调查总体的每个个体编上号码,然后将号码写在卡片上搅拌均匀,任意从中抽选,抽到一个号码,就对上一个个体,直到抽足预先规定的样本数目为止。这种方法适用于调查总体中个体数目较少的情况。 2)随机数字表法。随机数字表法是先将总体中的全部个体分别标上l至n个号码,然后利用随机数字表随机抽出所需的样本。随机数字表又称乱数表,是一种按双位或多位编排的大小数互相间杂的数表,利用特制的摇码机器或计算机,用随机方法编制而得,客观上为表内任何数码都提供了相等的出现机会。下面,从随机数字表中选取100个数字,如表35所示。表35随机数字表 抽样选择时,在随机数字表中任意选定一行或一列的数字作为开始数,接着可从上而下或从左至右,或以一定间隔(隔行或隔列)顺序取数,凡编号范围内的数字号码即为被抽取的样本。如果不是重复抽样,碰上重复数字应舍掉,直到第三章抽样设计抽足预定样本数目为止。在顺序抽取的过程中,遇到比编号大的数字,应该舍去。 例如,现在要从80户居民中抽取10户进行收入调查,先将80户居民从180进行编号,然后假设从随机数表中第二行的第五列开始自左向右、自上而下取样,那么顺序取得的样本号为:35、50、75、12、25、47、70、33、24、03。由于96、83、87、97、93这五个数字大于80,故舍弃不用。 2简单随机抽样的优点和局限性 1)简单随机抽样的优点是方法简单,当调查总体中名单完整时,可直接从中随机抽取样本,由于抽取概率相同,计算抽样误差及对总体指标加以推断比较方便。 2)尽管简单随机抽样在理论上是最符合随机原则的,但在实际应用中则有一定的局限性,表现在:采用简单随机抽样,一般必须对总体中各个体加以编号,而实际所须调查的总体往往是十分庞大的,个体非常多,逐一编号几乎是不可能的。对于某些事物无法适用简单随机抽样,例如,对连续不断生产的大量产品进行质量检验,就不能对全部产品进行编号抽样。当调查总体的标志变异程度较大时,简单随机抽样的代表性就不如经过分组后再抽样的代表性高。由于抽出的样本较为分散,所以调查的人力、物力、费用消耗较大。因此,这种方式适用于总体的个体数不太庞大以及总体分布比较均匀的情况。二、系统抽样 系统抽样也称等距抽样,就是先将调查总体的各个体按一定标志排列起来,然后按照固定顺序和一定间隔来抽取样本个体。 排队所依的标志有两种:一种是按与调查项目无关的标志排队。例如,在住户调查时,选择住户可以按住户所在街区的门牌号码排队,然后每隔若干个号码抽选一户进行调查。另一种是按与调查项目有关的标志排队。例如,住户调查时,可按住户平均月收入排队,再进行抽选。 在排队的基础上,还要计算抽选距离(间隔),计算公式为: 抽选距离:习瓣 确定抽选距离之后,可以采用简单随机抽样方式,从第一段距离中抽取第一个个体,为简化工作并防止出现某种系统性偏差,也可以从距离的12处抽取第一个个体,并按抽选距离继续抽选余下的个体,直到抽够为止。 例如,从600名大学生中抽选50名大学生进行调查,可以利用学校现有名册按顺序编号排队,从第1号编至600号。 、 抽选距离:iN:等人:12人 从第一个12人中用简单随机抽样方式,抽取第一个样本个体,假设抽到的是8号,依次抽出的是20号、32号、44号 系统抽样与简单随机抽样相比,可使中选个体比较均匀地分布在调查总体中,尤其当被研究现象的标志变异程度较大,而在实际工作中又不可能抽选更多的样本个体时,这种方式更为有效,因此系统抽样是市场调查中广泛应用的一种抽样方式。 系统抽样也有一定的局限性,表现在: 第一,运用系统抽样的前提是要有调查总体每个个体的有关材料,特别是按有关标志排队时,往往需要有较为详细、具体的相关资料,这是一项很复杂和细致的工作。 第二,当抽选间隔和被调查对象本身的节奏性(或循环周期)相重合时,就会影响调查的精度。例如,对某商场每周的商品销售量情况进行抽样调查,若抽取的第一个样本是周末,抽样间隔为7天,那么抽取的样本个体都是周末,而周末往往商品销售量较大,这样就会发生系统性偏差(即各样本标志值偏向一边),从而影响系统抽样的代表性。三、分层随机抽样 分层随机抽样在市场调查中较多地被采用,它是先将调查总体的所有个体按某一重要标志进行分类(组),然后在各类(组)中采用简单随机抽样或系统抽样方式抽取样本个体的一种抽样方式。分层时注意各层之间要有明显的差异,不致发生混淆;要知道各层中的个体数目和比例;分层的数目不宜太多,每个层次内每个个体应保持一致性等。只有这样,才能使抽取的样本反映该层的特征,以提高样本的代表性,减少抽样误差。 分层抽样的方式一般有等比例抽样与非等比例抽样两种。 1等比例分层抽样 等比例分层抽样是按各层(或各类型)中的个体数量占总体数量的比例分配各层的样本数量。 例如,某地共有居民20000户,按收高低进行分类,其中,高收入居民为4000户,占总体的20;中等收入为12000户,占总体的60;低收入为4000户,占总体的20。从中抽选200户进行购买力调查,则各类型应抽取的样本个要比其他抽样方式抽选更多的个体,以降低抽样误差,提高抽样结果的准确程度。 当然,整群抽样的可靠程度,主要还是取决于群与群之间的差异大小,当各群问差异越小时,整群抽样的调查结果就越准确。因此,在大规模的市场调查中,当群体内各个体间的差异较大,而各群之间差异较小时,最适合采取整群抽样方式。五、几种概率抽样方法的选择及比较 在选择概率抽样方法时,要考虑以下三方面的因素。 1对抽样误差大小的要求 在简单随机抽样条件下,抽样误差大小主要受总体方差的影响。 在分层抽样的条件下,按某个标志进行分类再抽样,实际上各类(组)都进行了调查,抽样误差不再受各组间方差的影响,而只受各组内方差大小的影响。因此,在抽样个体数一定的情况下,分层抽样的抽样误差要小于简单随机抽样。按有关标志排队的系统抽样实际上是一种分类更细的分层抽样,其抽样误差更小。按无关标志排队的系统抽样,其误差与简单随机抽样相似。 整群抽样对所抽中的群(组)的所有个体都加以调查,因此其抽样误差太小不再受各群(组)内方差的影响,而主要取决于群(组)间方差的大小,但群(组)间方差往往很大。 根据调查经验,通常按有关标志排队的系统抽样方式的抽样误差最小,其次是分层抽样、按无关标志排队的系统抽样、简单随机抽样、整群抽样。在实际调查时,可根据对调查误差的不同要求,选择适当的概率抽样调查方式。 2调查对象本身的特点 有些现象,事先没有关于总体各个体的全面、详细的资料,就无法采用按有关标志排队的系统抽样,而只能采用其他抽样方式。同时,还要考虑对调查对象所能了解的程度,对调查对象了解得越周全,就越能采用准确性较高的抽样方式。 3人力、物力、经费和时间等各种调查条件 例如,在调查前考虑到抽出的样本可能极为分散,在各地都有,会增加调查往返的时间和费用,就可采用整群抽样方式,使调查样本相对集中,调查员行动半径缩小,以节省人力、费用和时间。 应该指出的是,强调根据调查要求和调查对象特点选择适宜的抽样方式,并不否认上述几种方式的结合运用。在实际调查中,往往是根据具体情况互相结合使用的。此外,在许多情况下,特别是在复杂的、大规模的市场调查中,抽取的调查个体一般不是一次性直接进行的,而是采用两阶段或多阶段抽取的办法,即先抽大的调查单元,在大单元中抽小单元,再在小单元中抽更小的单元,这种抽样方式称为多阶段抽样。我国城市住户调查采用的就是多阶段抽样,先从全国各城市中抽取若干城市,再在城市中抽选街道,然后在各街道中抽选居民家庭。多阶段抽样在抽取样本及组织调查时很方便,但在设计抽样调查方案、计算抽样误差和推断总体上比较麻烦。
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!