资源描述
单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第三章:市场调研的组织方式,非概率抽样(非概率选样),概率抽样与非概率抽样,常用非概率抽样的具体方式,概率抽样,抽样设计过程,抽样组织方式,样本容量的确定,影响样本容量的因素,确定样本容量的统计方法,第一节 非概率抽样,非概率选样,一 概率抽样与非概率抽样,按照抽选样本的过程是否遵循随机原则,抽样方法有概率抽样和非概率抽样。,所谓随机原则(,Principle of Randomness,)就是指在抽样时,总体结构中的每一个单位成为样本单位的概率相同,完全排除主观意向影响。所以概率抽样又叫随机抽样(,Random sampling,)。概率抽样有科学的统计理论基础,可以用概率理论给以解释,在营销调研中大多采用概率抽样。,非概率抽样与概率抽样相反,在抽样时,总体结构中的每一个单位被选为样本单位的概率是不相同或不可知的。样本可以按照调研人员设定的标准有意识地选取。,在营销调研中有时为了简单或方便也可使用非概率抽样,而且只要抽样工作适当,其准确度也会达到概率抽样的程度。,二、常用非概率抽样的具体方式,方便抽样,配额控制抽样,判断抽样,雪球抽样,一、便利抽样,含义:,方便抽样就是建立在抽样过程中的“方便”或“易接近”基础上的一种抽样方法。这种选择样本单位的方法通常用于街头行人访问和柜台前的顾客访问。,作用:,这种方法有时可以与探索性设计结合,用于探索性或实验性调研,这样可以以最低费用迅速地获取所需的近似估计值。另一方面,方便抽样在调研的预检测阶段也有应用价值。总之,方便抽样只适用于营销调研的某些特殊情况。,评价:,样本只有在目标总体单位差异小的情况下,才有代表性,否则会有很大偶然性,准确性差。所以不能用于描述性调研或因果关系调研中的对目标总体数据的估计。,返回,含义:,配额控制抽样是指按相关标志将调查总体单位分组,然后由调研人员按分配的比例在各组总体单位中主观判断抽取样本单位的方法。,分类:,按目的不同,例如,对某地区进行化妆品消费需求调查,确定样本容量为400名,确定年龄、性别、收入三个分类标准。(见下页),独立控制配额抽样:,是指按一个或以上分类标准分别分配样本单位数额的抽(选)样方法。,相互控制配额抽样:,是指按两个或两个以上的分类标准交叉分配样本单位数额的抽(选)样方法。,独立控制配额抽样样本设计:,年龄组样本分配表,性别组样本分配表,收入组样本分配表,年龄,分配数额,性别,分配数额,月收入,分配数额,18-34,80,男,女,200,200,500以下,40,35-44,120,500-700,100,45-60,140,700-900,140,60以上,60,900以上,120,合 计,400,合计,400,合 计,400,互相控制配额抽样样本设计:,月收入(元),合计,(人),500以下,500-700,700-900,900以上,性别,男,女,男,女,男,女,男,女,年,龄,18-34,4,4,10,10,14,14,12,12,80,35-44,6,6,15,15,21,21,18,18,120,45-60,7,7,17,18,24,25,21,21,140,60以上,3,3,8,7,11,10,9,9,60,小计,20,20,50,50,70,70,60,60,合计(人),40,100,140,120,400,分类,分类,配额,配额控制抽样的具体实施过程如下:,选择分组标志:根据营销调研目的以及总体中各单位的性质和客观条件,选定调查的分类标准,作为总体分类依据。,分组并列出配额比例表:,等比例分组:按人口统计资料,不等比例分组:根据人口统计资料,再综合考虑以下四方面因素调整样本分配比例:A各类单位占总体单位总量的比例;B各类单位内部差异程度;C在实现调查目的过程中各类单位所处的地位和作用;D在各类中抽选样本和实现调查的难易程度。,月收入(元),合计,(%),500以下,500-700,700-900,900以上,性别,男,女,男,女,男,女,男,女,年,龄,18-34,1,1,2.5,2.5,3.5,3.5,3,3,20,35-44,1.5,1.5,3.75,3.75,5.25,5.25,4.5,4.5,30,45-60,1.75,1.75,4.375,4.375,6.125,6.125,5.25,5.25,35,60以上,0.75,0.75,1.875,1.875,2.625,2.625,2.25,2.25,15,合计(%),10,25,35,30,100,分类,分类,比例,配额(等)比例表,确定各分类标准下的样本单位配额(见上上表)。表中的配额是由样本配额比例表中的比率乘样本单位总数求得的,如:,4001%=4,即为月收入,500,元以下,,18-34,岁的男性人数。,配额指派,抽选样本单位(调查单位)。即由调查员根据派到的配额范围,判断抽选出单位。,评价,优点:,如果现场访问人员进行实际选择工作时,诚实而准确地按分配好的比例完成配额,则样本将与选定的总体参数相符,样本代表性较强;而且操作起来也较容易。因此市场营销调研中经常采用配额控制抽样方法。,缺点:,有时会遇到总体单位的情况不清楚,或难于确定总体的有关特征,这时分组及确定样本配额比例难度就大。,由于现场访问人员必须承担完成规定特征的人数配额的任务,有时他们是有压力的。不负责的调研员容易敷衍了事。,注释,这种配额控制抽样方法在美国的市场营销调研中应用非常广泛,一些营销学家说,“该方法甚至比随机抽样法应用要广泛”。在美国有许多大型的全国性的“调查对象网络”(National Panels) 。,这种调查对象网络是一种半永久性的样本(Semipermanent Sample), 样本中的成员都事先已同意提供资料或意见,网络组织与样本成员界时用信函联系即可,费用很少,因此这一组织又叫作(Consumer Mail Panels-MP)。,这些调查对象网络组织就经常使用配额控制抽样法完成调研任务,效果非常好。在这方面做得最好的是美国市场调研公司(Market Research Corporation of America)和全国家庭意见研究公司(The National Family Opinion, INC.),返回,含义:,判断抽样是一种经思考或主观判断来选取样本进行调查的方法。判断抽样的样本代表性如何,完全取决于调研人员本身的知识、经验和判断能力,因为具体样本单位的抽选完全是由主观判断而定。,分类:,见解抽样(Sampling by Opinion):是指由熟知总体情况的人,(如专家或调研人员)来判断并决定(样本单位)。,统计判断法(Statistical Judgment):是指以事先明确选择标准,详细研究有关选择标准的资料为基础,寻找出合乎标准规格的样本成员,进行调查的方法。,评价,优点:,操作简单、方便;在多层或多阶段抽样过程中有应用价值。,缺点:,主观性随意性强,不容易保障样本代表性,抽样误差难以控制。,总结:,因此,判断抽样法要求调研人员必须熟悉总体的特征,尽量选择多数型或平均型的单位为样本,以控制调查结果误差,返回,含义:,雪球抽样是指先利用随机方法或社会调查选出原始受访者;抽样后,再根据原始受访者提供的信息去联系其他受访者。,用途:,当总体很难寻找或十分稀少时,可采用此法。例如对单亲家庭的抽样最好使用此法,因为单亲家庭是稀少的,难寻找的现象。,第二节 概率抽样,一 抽样设计过程,确定,从中,抽取,样本,的总,体,建立,总体,的构,架,选取,抽取,样本,单位,的具,体方式,确定,所需,样本,的容,量,写出判断和抽取实际样本单位的说,明书,步骤一:,确定总体。根据调研目标确定研究总体(母体)。,步骤二:,建立总体的“抽样框”。抽样框又叫抽样构架或抽样结构,实际上它就是指可以备选作为样本的全部总体单位的顺序或编排形式。,三种形态,A、,具体的抽样框。即抽样单位可列成表册的型态。包括目录结 构、 区域结构和目录区域复合结构)。,B、,抽象的抽样框。即抽样单位没有表册而是开放的型态。只要符合调查条件就是抽样结构中的元素。,C、,阶段式抽样框。在采用分段抽样设计时,按照抽样阶段不同,可产生不同的抽样结构。,步骤三:,决定抽取样本单位的具体方式。有四种具体方式可供选择。,步骤四:,抽样方式一旦确定,就应决定所需样本的大小(样本容量)。样本容量的确定是一个较复杂的问题,后面将具体分析。,步骤五:,作出抽样计划的决策。这是从最终样本中收集基本资料的准备工作。这里包括要有一个非常准确而又具体的指导实地选取样本工作的说明书。只有备妥说明书后,抽样设计和计划工作才算完成。,二 抽样的组织方式,简单随机抽样,分层抽样,(Stratified Sampling),系统抽样,(Systematic Sampling),整群抽样,(Cluster Sampling),多阶段抽样,两阶段抽样,(Two-stage Cluster Sampling),多阶段整群抽样,(Multistage Cluster Sampling),简单随机抽样,含义:,简单随机抽样又称纯随机抽样,它是指对总体不进行任何分组,归类或排序等,而完全按随机原则抽取样本的方法。其特点是总体结构内的每个单位被抽中的概率完全相等,各单位之间相互独立,没有任何关联性和排斥性。,做法:,抽签法,首先给总体中的每个单位编上号,然后将序号写到标签或卡片上,建立一总体构架(Frame)。然后将标签搅拌均匀,再从中抽选;被抽到的号码所代表的单位即为样本的一员,直到抽足预先规定的样本容量为止。这种方法比较麻烦,工作量大。如这章前面我们所举例子,从20,000名学生中抽取500名,那么调查者要分别建立20,000张卡片,才能混匀抽样。费时费力,因此他们宁可使用下述方法。,随机数表法,这种方法实际上是用随机数表代替了抽签法的标签或卡片,可以省去制作卡片的环节。随机数表是用特别编码机或电子计算机编制成的数字群,完全符合随机原则。一般为查用方便编成五位一组。,使用随机数字表抽样过程是,首先把总体单位随意编号,建立总体构架;然后从数字表的任何行列的数字开始,向任何方向顺序抽选号码;遇到属于总体构架范围内的随机数即中选,遇上重复的数或构架范围外的随机数即跳过,直到抽够规定的样本容量为止。例如,上例中要求从,20,000,学生总体中选,500,个人,调研人员先将,00,000,至,19,999,的号数分给每个学生,那么任何大于,19,999,的五位数就不考虑了。假如选定从表的一行一列五位数开始,,1,009,,小于,19,999,,于是将其作为,200,个样本单位之一;然后由此向下(也可能向右),第二个数是,37,542,,太大,就跳过去;再下一个数是,08,422,,可以选中。这样连续选择,直到选中,500,个五位数码为止,这些数码代表的学生就是我们选取的样本。,评价,简单随机抽样是最基本的概率抽样方法,是其它概率抽样设计的基础。其优点是在抽样中完全排除主观因素的干扰,数理上最符合随机原则,简便易行。,但这种抽样设计也有其局限性,它只适用于总体单位明确,总体单位总量不太大,单位分布较集中和总体单位之间差异较小等情况的总体。,返回,分层抽样,含义:,分层抽样又称类型抽样,它是根据市场调查的目的和要求将总体单位按其属性特征分为若干组(或类型),使组内差异小,组间差异大,然后从每组(或类型)中成比例或不成比例地随机抽取样本单位的组织方式。,例如,我们要抽样调查家庭成员平均消费支出的情况,我们可将家庭总体按家庭人数分层(类),如下表。我们可以分别在各层中抽取一定量家庭组成样本进行调查, 用所得数值推断总体水平。,家庭大小(人),各层家庭占总体比例(%),1,10,2,15,3,68,4,4,4以上,3,操作:,成比例的分层样本,从各层抽取多少样本单位,可以按各层总体单位数与总体单位总量之比例确定,也可以不按此比例确定,而前者似乎要简单一些。成比例的分层样本也就是按照上述比例确定的样本,它的量的确定等于样本容量乘以各层所占比例的积之和。如前述的家庭总体例子中,如果要抽出家庭的样本,那么第一层要抽选40个家庭(40010%);第二层60个;第三层272个,第四、五层分别为16个和12个,合计共400个家庭。,不成比例的分层样本,(,Disproportionate Stratified Samples,),成比例的分层样本的设计和抽取虽然简单易行,但有时其效果可能是不好的。这时就应使用非比例分层抽样法更好一些。,例如,表,7-8,是某地区食品零售企业的分类资料。在这个例子中,如果是成比例分层样本就是按每层食品店数目的百分比分摊样本。于是在,400,家的样本中,确定联锁店将达,32,家(,4008%,),而小型零售店将有,160,家,(400,40%),。仔细分析,这种设计显然是不合逻辑的。因为小型零售店所占店数比例虽大,但销售额却只占总销售额的一部分;相对来说,其对所调研的问题来说并非那么重要。可见按商店数目的百分比分摊样本是不恰当的。,表7-8 非比例分层举例,食品店类型,各类食品店占食品店总数百分比,各类食品店销售额所占比例,连锁店,8,26,合作店,10,30,大型零售店,12,16,中型零售店,30,19,小型零售店,40,9,合计,100,100,对本例最好采用不成比例样本抽样,即综合考虑比例以外的其它因素来确定各层样本单位数的多少。这些因素主要有:(1)反映各层在总体中重要性的因素,如上例中的各类食品店销售额百分比因素就属这种情况,于是联锁店应抽取104个(40026%),而小型零售店只抽取36家(400,9%)即可。(2)各层内部单位间的差异程度大小。差异程度大的层应分配其多些样本单位;差异程度小的层应分配其少些样本单位。(3)各层实现抽样调查的平均费用多少。一般应按最低成本原则确定各层样本单位。此外,样本容量的确定还有一最重要的技术因素,这将在后面介绍。,从以上的叙述来看,分层抽样似乎类似于非概率抽样中的配额控制抽样,特别是按比例抽样设计更明显一些。我们认为它们之间的根本区别就在于,分层抽样在最后的抽样操作阶段是完全按照随机原则抽取样本的,如可以采用简单随机抽样,也可以采用系统抽样。因此分层抽样有很强的或严密的技术要求,如控制其抽样误差,按期望的置信区间和置信概率进行操作等。这些都是配额控制抽样不能比的。,评价:,优点:,(1)它适用于总体单位数量较多且单位间差异较大的调查对象;,(2)在样本容量相同时,它比简单随机抽样误差小,或者在抽样误差要求一定时,它比简单随机抽样所需样本容量小,代表性强。,局限性:,主要是它要求调研设计人员必须对总体单位的情况有较多的了解,否则难以设计出科学合理的分层样本。而要做到这一点往往是比较困难的,或者必须花费更多的时间和精力。,返回,系统抽样,含义:,系统抽样又叫等距抽样,它是在随机抽取第一个样本单位以后,然后自此每隔R(= N/n) 个单位再选取其它所有样本单位进行调查的方法。,步骤:,将总体单位按一定标准有序排列,编上序号。如果排列标准采用与调查项目有关的标志,如收入高低、年龄大小等依高低次序排队,则称其为有关标志系统抽样;如果排列标准无特定标志,即与调查项目无关,如以编号、地理位置、地名笔划、工商企业名录等作为排列依据,则称其为无关标志系统抽样。,按随机原则确定第一个样本单位的位次(抽样)。,计算以第一个样本单位为起点的各样本单位间的抽样距离。公式为R =N /n 。其中R为抽样距离;N为总体单位总量;n为样本容量。若遇上计算结果有小数时,要四舍五入划为整数距离,并且将总体单位排列成一个封闭圈,以避免出现不足样本单位量的情况。,按确定的抽样距离进行等间隔抽取样本,直到满足样本容量。,评价,优点:,(1)有关标志排队的等距抽样,能产生比简单随机抽样更具代表性的样本。,因为总体的各部分都能在一定程度上被包括到样本中,能保证被抽取的样本单位在总体中均匀分布。,(2)在调查的组织工作上有许多方便之处,便于抽样,容易实施。,缺点:,当总体单位排序恰好与抽样间隔周期一致时,存在着可能选取到一个严重偏差的样本的风险。,返回,整群抽样,含义:,先把总体按其自然形态(一般是地域范围)分为若干群,然后随机抽取一两个或若干个群作为样本,并对已抽中的群所包括的单位进行全面调查。,评价,优点:,(,1,)它适用于没有或难以构造总体框架的总体的抽样调查。,(,2,)调查单位比较集中,工作方便,可以减少调查人员旅途往返时间和费用。,缺点:,也正由于调查单位集中,显著地影响了单位分布的均匀性,导致在样本容量一样情况下,整群抽样的抽样误差大于其它方法的抽样误差。,所以最好在那些由情况大体类同而比较复杂的团体或群体组成的总体内使用整群抽样法,因为这时的样本代表性会强一些。,返回,多阶段抽样,两阶段抽样,(Two-stage Cluster Sampling),在样本容量一定情况下,为了提高样本代表性,有时可将整群抽样设计为两阶段。即先将调查总体各单位按一定标准(一般是区域)分成若干群体作为抽样的一段群体;然后将各一段群体又分成若干小的群体,作为第二段群体;再按照随机原则,先抽选出若干一段群体即为一段样本群,然后再在一段样本群体中抽选出第二段样本群;最后,对第二段样本群体进行全面调查以推断总体的情况。,假定天津市有,200,个街,每个街有,20,个居委会;我们拟从这,4000,个居委会的总体中选取,100,个居委会样本群;于是总的抽样比是,100/4000=1/40,,也就是平均来说对居委会的总的抽样比是,40,个抽,1,个。在各种情况下,街区抽样比(一段抽样比)和居委会再抽样比(二段抽样比)的积必定等于,1/40,。因此,如果调研人员想要以,1,:,P1P2,的比例抽取第二阶段样本群,可以通过,1,:,P1,的比例,选取一段样本群和以,1,:,P2,的比例(从所选的一段样本群中)选取第二段样本群来完成。即选取概率,为,。,本例中 ,,假如以1:2比例选取一个街区样本群,然后可以按1:20比例从所选街区中选取居委会样本群。因为第一段抽取100个街区,(1/2200),,第二段在100个街区中又各抽取了一个居委会,(1/20200),,这样的抽样结果是抽出100个居委会。就这个例子来说,还可设计出其它五种两阶段抽取100个居委会群体的方法,如表所示。,抽样方法编号,第一阶段抽样比,(1/P1),第二阶段抽样比,(1/P2),总抽样比,(1/P1P2),第一阶段选区区街数,第二阶段从各选中的街区中选区的居委会数,1,1/2,1/20,1/40,100,1,2,1/4,1/10,1/40,50,2,3,1/8,1/5,1/40,25,4,4,1/10,1/4,1/40,20,5,5,1/20,1/2,1/40,10,10,6,1/40,1/1,1/40,5,20,无论用哪种方法抽样完毕,即可确定被抽中的居委会的区域,由调查人员对这些居委会所包括的全部家庭进行调查。,调研人员应当选择哪一种方法,要视具体情况而定。从收集资料的费用来看,第二阶段抽样比值应当取高值。第二阶段抽样比值取高值,就会有许多家庭从所选的每一街区中抽取出来;这样使实地调查集中在少数的街区内进行,因而节省了调查费用。据此原则最好选择表中的“抽样方法,6,”,。,从统计效果来看,则需要较小的第二段抽样比值。因为这样可以使样本单位分布范围更大些更均匀些,这样的样本代表性是最好的,据此样本推断总体参数,效果也是最好的。按照这个原则就宁可选择“抽样方法,1”,。在实际的抽样过程中,往往要同时考虑费用和统计效果两个因素,因此在列举的两阶段抽样比之间需要找到一个最佳的折衷点。,返回,多阶段抽样,多阶段整群抽样,(Multistage Cluster Sampling),由于抽样阶段过多也会带来工作的繁索,因此一般以设计为三个阶段,至多四个阶段为宜。而且多阶段的各个阶段抽取方式,可以用简单随机抽样或系统抽样;各阶段可用同一种抽样方式,也可用不同抽样方式,视具体情况而定。,但由于整群抽样要求群间差异要尽量小,因而不宜采用分层抽样方式抽取样本群。,多阶段整群抽样的优点可概括为下述几点:,1,由于多阶段抽样过程,前几个阶段都是过渡性的,直到最后一个阶段才能抽取实地调查单位,因此,多阶段抽样设计,为最后抽取调查单位提供了极大的便利。,2,在调查总体范围大、单位非常多、情况复杂的抽样调查中,采用多阶段抽样,可以节约大量人力,旅途往返费用和时间。,3,可以使抽样方式更加灵活和多样化。这种多阶段抽样设计实际上可看作是各种抽样方式结合应用的抽样设计。,多阶段整群抽样设计的基本原则,同样是各阶段抽样比的积等于总的抽样概率,用公式表示为 。 现将上述两阶段抽样所用例子改为:,自,200,个街区中抽取部分街区;从选中的街区中抽取居委会;再从选中的居委会中选取居民户的三阶段抽样。假设各街区中每个街区有,20,个居委会,共,400,000,个家庭;最后要抽取,2,000,个家庭作为样本进行调查。于是总的抽样比,(,概率)为,,,按此抽样比我们可有下,述三阶段抽样的多种设计方法:,表 2000户家庭的三阶段整群抽样设计,方法编号,一阶段抽样比,(1/P1),二阶段抽样比,(1/P2),三阶段抽样比,(1/P3),总抽样比,(1/P1P2P3),一阶段选取区街数,二阶段选取居委会数,三阶段选取家庭数,1,1/2,1/10,1/10,1/200,100,2,10,2,1/4,1/5,1/10,1/200,50,4,10,3,1/5,1/4,1/10,1/200,40,5,10,4,1/8,1/5,1/5,1/200,25,3,20,5,1/5,1/10,1/4,1/200,40,2,25,注意点,概率与样本容量成比例的抽样的问题,(PPS-Probability-Proportional-to-Size Sampling),户转人抽样的问题,(Households to Persons Sampling),概率与样本容量成比例的抽样的问题,前几种抽样设计中,我们没有考虑各阶段的同级群体的大小因素,或者说它是以假定各群体大小相同为前提的。在实际调查过程中,这种情况是极少见的,更多的情况是划分的各群体大小不一样。那么,我们一旦遇到抽样群体大小极不相同时,最好利用抽选概率与样本容量成比例的抽样方法,简称PPS法。这种方法实际上是对前述几种方法的修正,使得原先大小不同的群体被抽中的概率相同变得不同,以保证样本容量大的群体被抽中的可能性大于样本容量小的群体。其具体的操作过程如下:,(,1,)决定在最后阶段抽取的样本总容量和调查群的平均规模。我们假设要从,1000,户家庭的总体中选一个总容量为,60,的样本,每户家庭被选取的可能性(总概率)为,60/1000,即,0.06,;从所有居委会中抽选,3,个居委会,平均自每个居委会抽取,20,户家庭。,(,2,)列出(或估计)各群体实际包括的最终样本单位数。我们这里只设计两阶段抽样,那么就是列出第一阶段的每个居委会的家庭数(前几种设计是不考虑这个因素的),并将每个居委会按地理位置或容量大小排列,就成了分层抽样构架,这会大大提高样本的代表性。,(,3,)计算出抽样构架的累计容量。本例就是家庭累计数,并分给每个家庭,1,个,1,至,1000,中的号码(见表,7-11,)。,表7-11 概率与样本容量大小成比例的抽样表,居委会序号,各居委会家庭数,家庭数累计,累加号码,抽中单位,1,300,300,001-300,071,2,225,525,301-525,324,3,125,650,526-650,4,200,850,651-850,5,150,1000,851-1000,953,合计,1000,3,(,4,)用简单随机抽样法抽取,3,个居委会,即为第一段抽样。当然也可用系统抽样法进行第一段抽样。假如我们这里用随机数表抽到,3,个号分别为,324,、,071,和,953,,于是样本居委会序号是,2,、,1,和,5,(见表,7-11,最后一栏)。 这种抽样就使得容量不等的居委会有与其成比例的不同的中选概,率,本例中分别为,(,5,)检验第一阶段被抽中的群体的有关信息后,即进行第二阶段抽样。第二阶段抽样同样可以使用简单随机法或系统抽样法。本例使用简单随机法,从序号为,1,、,2,、,5,的三个居委会中各抽取,20,户家庭,组成容量为,60,的调查样本。这种抽样结果中,各居委会中的各家庭的中选概率可按下式计算:,各居委会内家庭,=,第一阶段中选,第一阶段居委会,第二阶段各居委会内,中选概率 的居委会数 中选概率 家庭中选概率,1,号内家庭中选概率,= 0.06,2,号内家庭中选概率,=,0.06,3,号内家庭中选概率,= 0.06 ,因此,不论群体包括的单位数(或次级群体)是多少,有多大差异,各总体单位(或各次级群体)被选中的总概率都将与开始要求的总抽样比完全一样;而且两阶段设计也可以推介到多阶段设计。这与以上所有抽样设计的要求一样,只是更合理一些。因此这种整群抽样方法应用频率是最高的。,返回,户转人抽样的问题,在对整群抽样样本实施具体调查时,经常会遇到一个很重要又很具体的问题(其它抽样方式有时也会遇到),就是要准确合理地确定具体访问对象的问题。最后抽中的“群”是企业,访问对象是董事长、总经理、副总经理,还是某个部的部长?这显然是一个严肃的问题;最后抽中的“群”是家庭户,(Households),,那么访问对象是这个家庭的女主人、男主人还是其他人呢?还是规定的年龄(如,18,周岁)以上的全部成员呢?这也是应很好地落实的问题。上述这类问题我们归结为“户转人”问题。这个问题解决得如何,也直接影响着最后调查的结果。,从理论上说,不管那一个“群”,都应该选取有发言权决策权的人作为直接访问对象。如企业群中在购买电脑、办公设备这些小的问题上,就没必要把总经理定为直接访问人,只询问有关部长甚至购买人员即可;在家庭群中往往确定家庭主妇或男主人为访问对象即可。但当有时难以进行这种人为判断时,最好的办法是将候选人员进行随机抽样加以确定。为此,美国教授克什创造了户转人随机抽样程序表。下面我们介绍一下这个抽样表的使用程序。,(,1,),首先确定户的编号,这个编号在问卷中即为问卷编号。如前例中的,071,、,324,、,953,等。,(,2,),确定该户中符合调查对象条件的人数,如有几个成员在,18,周岁以上。,(,3,),将符合调查对象条件的人按年龄从小到大顺序排列;或从大到小顺序排列。,(,4,),查表,以确定何人为被调查对象。方法是:以户编号尾数为“列”,以符合条件的家庭成员人数排例为“行”,行列相交点上的号码表示该户被调查成员的顺序号和调查该户年龄排行的第几号成员。该随机抽样表如表,7-12,。,1,2,3,4,5,6,7,8,9,10,1,1,1,1,1,1,1,1,1,1,1,2,2,2,1,1,2,1,1,2,1,2,3,1,2,3,2,1,2,3,1,2,3,4,3,1,2,3,1,4,4,2,3,1,5,4,3,3,1,5,5,2,1,4,2,6,5,4,6,2,3,6,1,4,3,5,7,6,5,7,4,2,1,7,3,6,4,8,7,1,4,5,6,3,2,8,7,1,9,8,6,2,7,4,9,1,5,3,6,10,4,3,5,1,8,2,0,6,5,9,符合条件家庭成员数,户编号尾数,调查对象序号,例如,前例中的071号家庭,有3个符合条件的家庭成员,查表是1列3行对应的号码是1,于是确定该家庭成员的第一号(年龄排序)成员为调查对象。324号家庭有4个符合条件的成员,于是4列4行对应的号码是3,即确定该家庭的年龄排行第3号成员为调查对象。,应当注意的是,从每户中只选一个成员进行调查,而各户的人数不尽相同,这时就造成了抽样概率不同的问题。如1人户被抽中的概率是1,而3人户中各成员被抽中的概率只有1/3,解决的办法就是分配权数给不同被抽中的人员。如1人户权数为1;2人户权数为2;3人户权数为3,以此类推。尽管在实际营销调研中有许多变量很少受家庭规模的影响,但大多数变量是与家庭规模有较强的相关性,固而应重视使用权数的调整。,第三节 样本容量的确定,一 影响样本容量的因素,总体的规模大小,被研究总体内部单位间的标志变异程度大小,(,),调研项目预算的情况,抽样误差控制范围的大小( 或 ),抽样推断结果的把握程度(置信概率)和概率度大小,(F(t)),抽样设计方案及抽样操作方法也与样本容量有关。,二 确定样本容量的统计方法,在上述讨论抽样方案设计过程中,已经涉及到样本容量的确定问题,而且也有了一定的技术方法,但相对于统计方法来说,那只是方便操作的经验方法。对于概率抽样设计,严格地说必须使用统计方法确定样本容量,即将上面的影响样本容量的因素量化,依据抽样统计原理要求进行推算。例如对于简单随机抽样设计而言,抽样平均数的平均误差公式是:,重复抽样:,非重复抽样:,我们可以通过抽样误差范围公式来推算必要的样本容量:,在重复抽样的条件下,,由 得:,又由: 得:,推出必要的样本容量计算公式:,在不重复抽样条件下,可按上述原理推出必要的样本容量计算公式为:,同理,我们可推导出抽样成数的样本容量计算公式分别为:,在重复抽样条件下:,在不重复抽样条件下:,在抽样设计时,又如何取得上述公式中总体方差,和总体成数P(1-P)数据呢?一般可用下列方法估计:,1 可以用以往或类似调研资料来估计。如果从不同的途径算出对方差的几种不同的估计时,一般应选用其中最大的;对于总体成数代用值应取最靠近0.5的P值,因为这时得到的P(1-P)的计算结果最大。,2可以从被估计总体中抽出一个前导样本或预选样本,把从这个样本中算出的样本方差(s)或样本成数(p)作为总体方差(,)或总体成数(P)的估计值。在这种情况下,前导样本中抽出的单位可作为正式样本中的一部分。因此在抽取前导样本后,再需抽取的样本单位数应为,n -n,1,; 其中的,n,为计算出的样本容量,,n,1,为前导样本的容量。,在营销调研中,要研究的总体通常都是有限总体,而且多使用不重复抽样方式,因此下面我们列出使用各种抽样方案时不重复抽样条件下的样本容量计算公式(以平均数推断调查为例),以供直接计算使用:,简单随机抽样 :,分层抽样,(,等比例,),:,分层抽样,(,不等比例,),:,整群抽样 :,上式中N i 和 分别表示第 i个次总体的单位数和方差;,r 表示应抽取的群数;,R 表示总体所含群数;,表示群间方差。,关于系统抽样的必要样本容量的计算,一般可借用简单随机抽样的必要样本容量计算公式。当按有关标识进行排队,并且还可以估计出各段段内方差时,也可以使用分层抽样的公式来计算系统抽样的必要样本容量;此时,就是将系统抽样的每个段看作一个层。,
展开阅读全文