资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,第三章 抽样设计,案例,1,1936,年,美国总统选举前夕,两家民意测验机构就谁将当选总统进行民意调查。,竞选人,党派,得票率,F.Roosevelt,民主党,60.8,A.Landon,共和党,31.5,W.Lemke,小党,调查结果是:共和党候选人,Landon,将以压倒多数的票数当选总统。,文学文摘,杂志耗资,50,万,发放,1000,万份问卷,回收,200,万份。,盖洛普(,Gallup,)美国舆论研究所抽了,3000,个选民,预测结果是:,先来看一个例子!,调查结果是:,Roosevelt,的得票率为,54,,当选为总统,!,文学文摘,失败的主要原因是:他们按照电话簿发放问卷,而当时安装了电话的都是比较富有的人,因此,他们所调查的结果仅代表了比较富有的人的意见,,样本缺乏代表性,。,由这个例子可以看出,科学地设计抽样方法很重要!,收视率是指:收视人数除以整个市场电视人口数的百分比(如:收视率,2,,意味着,100,个人中有,2,个人收看),收视率影响广告商愿意花多少钱来买某节目的广告,以及该节目播不播下去。,案例,2,:,电视收视率调查,收视率在中国,央视索福瑞,公司,AGB,尼尔森,公司,尼尔森,公司,2008,春晚收视率调查,总体:,4.24,亿收视人群,样本:全国,14,省市,14,000,户家庭,(装有个人收视记录仪),标志:某一时段是否在看春晚节目,指标:全国家庭收视率,71.8%,央视索福瑞调查结果春晚收视率为,96.5%,央视索福瑞,CSM,公司,CSM,在全国建立了,9,个省网、,67,个单独城市调查站,样本总规模达到,18,500,户,2008,年春晚播出时,对全国,406,个区县进行了,3,个多小时的电话调查。共访问成功,2063,个家庭,其中,1899,个家庭收看了春晚,加权推算出全国有,96.5%,的家庭收看了央视春晚。,北京奥运会开幕式收视率,央视索福瑞:,68.8%,家庭,AGB,尼尔森:,86.8%,家庭,第三章 抽样设计,第一节 市场调查的基本类型,第二节 抽样调查的基本程序,第三节 抽样调查方法,第四节 确定样本容量,第五节 抽样误差,第一节 市场调查的基本类型,一、全面调查,第一节,市场调查的基本类型,为了掌握被研究对象的基本情况,收集,全面、准确,的调查资料,对调查对象的全部单位进行的,逐一的、无遗漏,的专门调查。也称,普查,。,1,、含义,案例:第三次全国人口普查,第三次全国人口普查,从,1979,年底成立国务院人口普查领导小组开始,到,1985,年,11,月正式结束,历时约六年。共花费人民币,4,亿元,其中包括联合国资助,1560,万美元。投入了,518,万普查员,,109,万普查指导员,,13,万编码员,,5000,余名计算机工作人员,并得到,1000,多万基层干部群众的配合。,此次普查规定人口登记的标准时间为,1982,年,7,月,1,日零时,全国各地都是在此时同时开展调查工作,并在,10,天以内完成调查登记工作。所调查的项目包括:姓名、与户主关系、性别、年龄、民族、文化程度。,第一节 市场调查的基本类型,(,1,)调查资料的准确性和标准化程度较高,(,2,)适合了解市场的基本情况和调查总体的特征,(,3,)花费的人财物和时间较多,2,、特点,第一节 市场调查的基本类型,二、抽样调查,引例: 假设有若干个白豆子和若干个黑豆子混装在一只桶里。请问你如何以最快的速度知晓桶里的白豆子和黑豆子各有多少呢?,第一节 市场调查的基本类型,日期,10.3011.2,11.13,11.13,11.23,11.23,11.34,11.34,选举结果,主办机构,New York Times,(,纽约时报),Reuter,(,路透社),Harris Poll,(,哈里斯民意测验),ABC,(,美国广播公司),NBC,(,国家广播公司),USA Today,(,今日美国报),Gallup,(,盖洛普公司),克林顿,54,49,51,52,51,51,51,49,多尔,35,41,39,39,38,38,38,40,佩罗特,9,8,9,7,9,9,9,9,其他,2,2,1,2,2,2,2,2,候选人得票百分比,案例:美国,1996,年大选,调查研究总体:美国全体选民,调查访问样本:,2000,名选民,(,11,月,5,日公布),第一节 市场调查的基本类型,抽样调查是采用一定的组织形式、按照一定的程序从所研究对象的全体(总体)中抽取一部分个体(样本)进行调查,用所获取的数据对总体的一定目标量作出推断。,1.,什么是抽样调查,返回本章,2.,抽样调查的种类,随机抽样,,是按概率原则,从总体中抽取一定数目的单位作为样本进行观察。,非随机抽样,,是从方便出发或根据研究者主观判断来抽取样本,。,(,简单易行,尤适用于探索性研究,),实验法,非随机抽样,抽样技术,随机抽样,等 距 抽 样,简单随机抽样,分层抽样,整 群 抽 样,多 阶 段 抽 样,方 便 抽 样,判 断 抽 样,配 额 抽 样,滚 雪 球 抽 样,3.,抽样调查的几个基本概念,总体与样本,总体,(,Population,),是所要调查的全体,其中每个被调查对象叫个体。,样本,(Sample),,是总体的一部分,是从总体中抽选出来所要直接观察的全部个体。,如:从某省总数为,10,万人的大学生总体中按照一定方式抽取出,1000,名大学生进行调查,这,1000,名大学生就是构成总体的一个样本。(,从一个总体中可以抽取出若干个不同的样本,),课堂讨论,为了了解统计学专业本科毕业生的就业情况,我们调查了某地区,30,名,2010,年毕业的统计学专业本科生实习期满后的月薪情况。,什么是总体?,什么是样本?,芜湖电视台想了解生活频道栏目在芜湖的收视率情况,于是委托某市场咨询公司进行一次电话调查。,该项调查的总体是什么?,该项调查的样本是什么?,总体指标与样本指标,总体指标,是根据总体中各标志值计算的,用于反映总体数量特征的定量指标,也称,全及指标,或,总体参数,。,样本指标,是根据样本中各标志值计算的,用来估计和判断总体数量特征的随机性指标,也称为,抽样指标,。,返回本章,3.,抽样调查的几个基本概念,大样本与小样本,根据抽样调查中所抽选样本容量不同而划分的。,当样本数目大于,30,时,称为大样本;当样本数目小于,30,时, 称为小样本。,3.,抽样调查的几个基本概念,重复抽样与不重复抽样,重复抽样,又称回置抽样,(,有放回抽样,),,是一种在总体中允许重复抽取样本单位的抽选方法。抽样过程中总体个体数始终相同。,不重复抽样,又称不回置抽样(无放回抽样),即先被抽选的个体不再放回到总体中去,任何个体一经抽出就不会再有第二次被抽取的可能性。抽样过程中,总体个体数逐渐减少。,3.,抽样调查的几个基本概念,抽样框与抽样单元,抽样框,,指供抽样所用的所有调查单位的详细名单,抽样框有两类:,(,1,)从一个调查单位总体中抽取样本,可称为一次性抽样框。,(,2,)抽样工作要经过两个或更多阶段才能完成,各阶段有不同的抽样框。,如:从某所大学全体学生中直接抽取,200,名学生作为样本,该校全体学生的名单,从某一所大学所有班级中抽取,3,个班级作为样本,该校所有班级的名单,抽样单元,,,为了便于抽样,通常把总体划分为有限个互不重迭又穷尽的部分,每个部分称为一个抽样单元。,3.,抽样调查的几个基本概念,4,.,抽样调查的适用范围,无法全面调查的情况,如全国性城市居民住房面积的调查。,不必要进行全面调查的情况,如产品质量的检测。,需要快速得到调查结果,如节令市场的状况调查。,在经费、人力、物力和时间有限的情况下开展的调查。,对全面调查进行验证。,对某种总体进行假设性检验,也常用抽样调查来检验判断这种假设的真伪。,第二节 抽样调查的基本程序,第二节 抽样调查的基本程序,界定调查总体,选择抽样框,确定抽样方法,决定样本大小,评估样本正误,抽取样本,对总体的范围与界限做明确的规定,清楚地说明研究对象的人口统计学特征(时间、地点、年龄范围、收入范围、性别等)。,例:,2010,年,6,月,上海市,18-35,岁青年,一、界定调查总体,第二节 抽样调查的基本程序,宠物食品,一个定义明确的总体包含以下几个方面:,抽样单位是什么?(家庭、个人),什么条件指定包括在内?(人口统计特征、使用情况、认知),时间限制如何,要获取的信息属于哪一段时间?,空间限制如何,包括哪些地区?,第二节 抽样调查的基本程序,依据已明确界定的总体范围,收集总体中所有样本单位的名单,建立供抽样使用的抽样框。,准确的抽样框原则:,1,、完整性,总体中的每一个元素都必须包含在名单中,2,、不重复性,每一个元素都只对应于名单中的一个号码,问:,为了解重庆市中学生的饮料消费情况,需要从全市,500,所中学中抽取,10,所中学,再从每所抽中的中学中抽取,3,个班级,最后从每个抽中的班级中抽取,10,名中学生。需要选择哪些抽样框?,答:,分别收集三个不同层次的抽样框:全市,500,所中学的名单、每所抽中的中学里所有班级的名单、每个抽中的班级中所有学生的名单。,二、选择抽样框,以合理的成本选择误差最小的抽样框,第二节 抽样调查的基本程序,课堂小练习,请确定下面这些可能的抽样框。,1,、网球运动员,2,、养狗的人,3,、宝马车的拥有者,依据研究目的的要求、各种抽样方法的特点,以及其他限制因素决定采用哪种抽样方法。,三、确定抽样方法,考虑调查精确度的要求、总体性质、抽样方法和人力、财力等客观条件确定样本的大小。,其原则是:“代价小,代表性高。”,四、决定样本大小,第二节 抽样调查的基本程序,在上述几个步骤的基础上,严格按照所选定的抽样方法和数量,从抽样框中抽取一个个的样本单位,构成样本。,五、抽取样本,如何确定替代受访者:舍弃、过多抽样、再抽样,第二节 抽样调查的基本程序,对样本的质量、代表性、偏差等进行初步的检验和衡量,其目的是防止由于样本与总体偏差过大而导致失误。,六、评估样本正误,其基本方法是:将可得到的总体资料(如人口普查资料),与样本中的同类指标进行对比。通常使用两个或两个以上的标准。,总体特征,男生,78%,女生,22%,本省,64%,外省,36%,样本特征,男生,45%,女生,55%,本省,80%,外省,20%,样本特征,男生,76%,女生,24%,本省,67%,外省,33%,第二节 抽样调查的基本程序,实验法,非随机抽样,抽样技术,随机抽样,等 距 抽 样,简单随机抽样,分层抽样,整 群 抽 样,多 阶 段 抽 样,方 便 抽 样,判 断 抽 样,配 额 抽 样,滚 雪 球 抽 样,第三节 抽样调查方法,按每个同学的学号进行抓阄,按全班同学的寝室进行抓阄,分为男生和女生两组,每组各,5,张,再采取抓阄的形式,给今天到得最早的十个同学,给十个我认识的同学,第三节 抽样调查的方法,十张电影票的故事,一、概率抽样,按照概率原理进行抽样,使总体中的每个样本单位都有一个,已知的,、,非零,机会被选入样本中,从而避免抽样过程的人为误差。,又叫随机抽样。,第三节 抽样调查的方法,非概率抽样:无法估计个体被选中的概率。,第三节 抽样调查的方法,(一)简单随机抽样,1,、含义,从总体中不加任何分组、排队,完全按照随机原则抽取样本单位的抽样方法。,又称纯随机抽样、简单任意抽样。,抓阄,彩票,(,1,)乱数表法,在乱数表中任意选定一行或一列的数字作为开始数,接着可从上而下,或从左至右,或一定间隔(隔行或隔列)顺序取数,凡编号范围内的数字号码即为被抽取的样本个体号码。如果不是重复抽样,碰上重复数字应舍掉直到抽足预定样本数目为止。,例如:有如下数字:,13,、,45,、,65,、,36,、,22,、,24,、,31,、,43,、,61,、,52,、,55,、,16,、,23,、,14,、,25,。每隔两位取一个数字,即可得到:,65,、,24,、,61,、,16,、,25,。,2,、操作办法,(一)简单随机抽样,(,2,),抽签法:,对各样本单位编号,制作同等规格、不同编号的卡片,充分混匀后随机抽取卡片,所抽取卡片的编号对应的样本单位即组成样本。,适合于规模较小的总体。,第三节 抽样调查的方法,(,3,),摇号法:,使用专门的机器对事先编号的各样本单位进行选择。,适合于规模较大的总体。,(一)简单随机抽样,3,、简单随机抽样的优缺点,(,1,)优点,直观明了,易估计总体指标,适合与其他抽样,方法结合使用,第三节 抽样调查的方法,(,2,)缺点,需要所有样本单位的完整列表,对于分散的大规模总体,实施抽样,困难,忽略总体已有的信息,抽样误差大,4,、简单随机抽样方法的适用性,总体数量较小,易获得所有样本单位的完整列表,样本单位之间差异程度较小或难以分组,总体在空间范围内较为集中,采用电子技术辅助调查的方法时,如,CATI,第三节 抽样调查的方法,(二)系统抽样,1,、含义,系统抽样:,将各样本单位按某标志值的大小进行,排序,,按照时间或空间上的,相等间隔,来抽取样本。,又称等距抽样、机械抽样。,按有关标志排序:比简单随机抽样更具代表性,按无关标志排序:等同于简单随机抽样,第三节 抽样调查的方法,2,、操作办法,将所有样本单位按某种标志排列,并连续编号;,计算抽样距离:,K=N/n,;(,遇小数四舍五入),在第一段抽样距离内,完全随机地抽取一个号码,设其所在位置的序号是,k,;,自,k,开始,每隔,K,个样本单位抽取一个,即所抽取的样本单位所在位置的编号依次为:,k,,,k+K,,,k+2K,,。,k+,(,n-1,),K,第三节 抽样调查的方法,1 2 3 4 5 6 7 8 9 10,11 12 13 14 15 16 17 18 19 20,21 22 23 24 25 26 27 28 29 30,31 32 33 34 35 36 37 38 39 40,41 42 43 44 45 46 47 48 49 50,51 52 53 54 55 56 57 58 59 60,61 62 63 64 65 66 67 68 69 70,71 72 73 74 75 76 77 78 79 80,N=90,,,n=10,,,则:,K=90/10 =9,;设,k=6,81 82 83 84 85 86 87 88 89 90,第三节 抽样调查的方法,某城市有私营企业,5989,个,拟定样本量为,100,个,进行企业营销状况调查。请问如何使用系统抽样方法进行抽样?,练习,练习,某城市有私营企业,5989,个,拟定样本量为,100,个,进行企业营销状况调查。请问如何使用系统抽样方法进行抽样?,1,、按照,5898,个私营企业的年销售额(或职工人数、利润总额等)进行排序;,2,、计算抽样距离:,K=5989/100=59.89,,,约等于,60,;,3,、采用简单随机方法在,160,号中抽取一个号码作为第一个样本单位,如,28,;,4,、以序号,28,为起点,依照抽样距离确定所抽取的其他样本单位编号为:,88,,,148,,,208,,。,直到抽足,100,个样本单位为止。,第三节 抽样调查的方法,3,、系统抽样的优缺点,(,1,)优点,直观明了,简单易行,样本有较好的代表性,适合与其他抽样方法结合使用,第三节 抽样调查的方法,3,、系统抽样的优缺点,(,2,)缺点,需要所有样本单位的完整列表,需要了解排序后总体的周期性变化,队列,赶场天,第三节 抽样调查的方法,4,、系统抽样的适用性,总体数量较小,易获得所有样本单位的完整列表时,能够按某一有关标志进行排序,对总体有足够的了解,总体的差异程度较大时,第三节 抽样调查的方法,(三)分层抽样,1,、含义,分层抽样:,将所有样本单位按某一有关标志,分成相互排斥的不同类型,在各类中,独立、随机,抽取样本。,又称类型抽样,分层随机抽样。,第三节 抽样调查的方法,行业,区域市场,消费者,2,、操作办法,确定分层的标志,如年龄、收入、职业;,将总体,(,N,),分成若干个互不重叠的部分,(,N1,,,N2,,,N3,,。),,,每一部分为一层;,根据样本量,(,n,),大小,确定各层应抽取的样本量,(,n1,,,n2,,,n3,,。),;,采用简单随机抽样或系统抽样的方法,从各层中抽取样本。,第三节 抽样调查的方法,子,样本,n1,40,n2,120,n3,40,N=20000,子总体,N1,4000,N2,12000,N3,4000,n=200,分层等比例抽样,n,i,/n,= N,i,/N,第三节 抽样调查的方法,分层等比例抽样,n,i,/n,= N,i,/N,练习,某地调查商业网点销售情况。该地区有商业网点,20000,个,计划抽取样本,200,个。按企业规模分层,大型商店,1500,个,中型商店,8500,个,小型商店,10000,个。采用分层比例抽样法,应从各层选取多少个样本单位?,第三节 抽样调查的方法,答案,大型商店应选取样本数,n,大,=,(,1500/20000,)*,200=15,(个),中型商店应选取样本数,n,中,=,(,8500/20000,)*,200=85,(个),小,型商店应选取样本数,n,小,=,(,10000/20000,)*,200=100,(个),第三节 抽样调查的方法,分层等比例抽样,n,i,/n,= N,i,/N,N=20000,子,样本,n1,60,n2,120,n3,20,n=200,分层非等比例抽样(分层最佳抽样),考虑各层在总体中比例、重要性、层内标准差计算抽取比例,n,i,/n,= N,i,*,S,i,/,N,i,*,S,i,N1,4000,N2,12000,N3,4000,子总体,第三节 抽样调查的方法,S1,300,S2,200,S3,100,练习,某机构要调查城市居民家用电器的潜在需求,这种商品的消费量与居民家庭收入水平相关。已知某城市有,100,万户家庭,且居民的收入水平差异较大,其中高收入家庭,15,万户,中等收入家庭,65,万户,低收入家庭,20,万户。本次调查拟抽取,1000,个家庭作为样本。,请问:,(,1,)该机构宜采取何种抽样方法?,(,2,)这,1000,个数量的样本是如何构成的?,第三节 抽样调查的方法,练习,调研背景同前。在该城市中,高、中、低收入家庭的标准差估计值分别为,S,高,=300,,,S,中,=200,,,S,低,=50,本次调查拟抽取,1000,个家庭作为样本。请问:,(,1,)该机构宜采取何种抽样方法?,(,2,)这,1000,个数量的样本是如何构成的?,(,3,)以上两种方法有什么不同?,第三节 抽样调查的方法,3,、分层抽样的优缺点,(,1,)优点,样本具有很好的代表性,便于了解总体内不同类别的情况,便于组织实施和汇总数据,第三节 抽样调查的方法,3,、分层抽样的优缺点,(,2,)缺点,需要对总体有深入了解,不易确定分层的依据,必须事先已知各层的大小,难以获得每个层次的抽样框,第三节 抽样调查的方法,4,、分层抽样的适用性,适用于数量较大的总体,总体各类别较明显(适合分类),层间差异大,层内差异小,第三节 抽样调查的方法,(四)整群抽样,1,、含义,整群抽样:,将总体分为,S,个互不重叠的相似子群,从这,S,个群中随机抽取若干群,对选中的群内各样本单位进行普查。,第三节 抽样调查的方法,样本单位扩大后的简单随机抽样,2,、操作办法,确定分群的标准(如行政区划、班级);,将总体,(,N,),分成,S,个互不重叠的群;,根据样本量,(,n,),确定抽取的群数;,采用简单随机抽样或系统抽样的方法,从,S,群中抽取确定的群数;,对所抽取群的样本单位进行普查,第三节 抽样调查的方法,N=900,n=300,a d e f b g i h i d f c h i c b c a h g d h i a c b d b a e i h e g c。,c b g i h i d f c b c a h g d h i a c b d b a e i h e g。,i d e,i,h i d f h i c b e h i a c b d h e,。,C,D,F,G,A,I,H,B,E,H,B,E,第三节 抽样调查的方法,整群抽样,c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c 。,e e e e e e e e e e e e e e e e e e e e e e e e 。,h h h h h h h h h h h h h h h 。,C,D,F,G,A,I,H,B,E,分层抽样,第三节 抽样调查的方法,B,E,H,通信公司将对某大学学生的通信消费状况进行调查,,样本数量为,800,个,。公司对该大学的学生情况不太了解,而且很难得到所有大学生的人员清单。但他们通过努力,获得了该学校所有班级的名单。为此,研究人员拟采用何种抽样方法?其步骤是?,练习,第三节 抽样调查的方法,答案,采取整群抽样法。其步骤是:,1,、对该大学的学生以班级分成若干群;,2,、随机抽取,20,个班级(群);,3,、获取被抽取班级的人员清单;,4,、对该,20,个班级进行普查,获得最终样本。,第三节 抽样调查的方法,3,、整群抽样的优缺点,(,1,)优点,在组织实施上简单易行,易于调查管理,节省人力、财力和时间,(,2,)缺点,样本的代表性差,第三节 抽样调查的方法,4,、整群抽样的适用性,难以获得完整的抽样框时,群间差异小,群内个体差异大时,调查时间紧、经费少,样本分布地区范围广、规模大的总体,第三节 抽样调查的方法,思考:分层抽样与整群抽样的适用范围有何不同?为什么?,当群间同质性高,群内异质性高时,适合于采用整群抽样的方法,当群间异质性高,群内同质性高时,则适于采用分层抽样的方法,分层抽样的样本是从每个层内抽取若干单元或个体构成,而整群抽样则是要么整群抽取,要么整群不被抽取。,课堂练习:,某中学有,4800,名学生,分为,4,个年级,,80,个班,现在要抽取,480,名学生进行学生身体健康状况调查,运用简单随机抽样、系统抽样、分层抽样和整群抽样的方法分别如何抽取样本?,(五)多阶段抽样,1,、含义,根据样本单位之间的隶属关系,把抽样过程分为几个阶段进行。,又称多阶段整群抽样、分段抽样。,第三节 抽样调查的方法,2,、操作步骤,从总体中随机抽取若干大群(子群);,再从这几个大群内抽取几个小群,这样一层层抽下来,直至抽到最基本的样本单位为止。,例,县,500,人,10,个乡,50,个村,第三节 抽样调查的方法,3,、多阶段抽样的优缺点,(,1,)优点,便于组织和实施,节省人力、财力和时间,抽样技术灵活多样,抽样框获取的难度小,(,2,)缺点,累积抽样误差大,调查精确度低,第三节 抽样调查的方法,4,、多阶段抽样的适用性,总体规模特别大,样本单位的地区分布范围特别广,当总体隶属关系、机构特征比较明显时,第三节 抽样调查的方法,案 例,某市有,24000,名教师,分布在全市,10,个区的,200,所学校中。现要抽取一个由,1200,名教师组成的样本,了解他们的住房需求。如果按照三阶段抽样的方法,有以下各种不同的抽样选择。请评价以下哪个方案为优?,第三节 抽样调查的方法,方案,1,抽,10,个区 每区抽,4,所学校 每所学校抽,30,名教师,方案,2,抽,2,个区 每区抽,20,所学校 每所学校抽,30,名教师,方案,3,抽,10,个区 每区抽,20,所学校 每所学校抽,6,名教师,方案,4,抽,8,个区 每区抽,15,所学校 每所学校抽,10,名教师,方案,5,抽,5,个区 每区抽,12,所学校 每所学校抽,20,名教师,方案,6,抽,4,个区 每区抽,10,所学校 每所学校抽,30,名教师,方案,7,抽,3,个区 每区抽,10,所学校 每所学校抽,40,名教师,方案,8,抽,2,个区 每区抽,10,所学校 每所学校抽,60,名教师,方案,9,抽,1,个区 每区抽,12,所学校 每所学校抽,100,名教师,第一阶段,第二阶段,第三阶段,第三节 抽样调查的方法,案 例,案例小结,B,如果又已知各抽样阶段子总体的差异程度,如果区与区之间差别很大,则所抽的区的规模就要大一些,如方案,1,;反之,则小一点;,如果区与区之间差别不大,而在每一个区中,不同学校差别很大,则减小第一阶段的抽样规模,加大第二阶段的抽样规模,如方案,2,;,如区与区之间差别不大,且学校与学校之间差别也不大,则尽量加大第三阶段的抽样规模,相应减小第一、第二阶段的抽样规模,如方案,8,或,9,。,第三节 抽样调查的方法,A,如果考虑样本具有较好的代表性,一般来说,样本覆盖的面越大,样本的代表性越好。则方案,3,最好,依次递减,方案,9,最差;方案,1,、,2,居中;,D,综合考虑抽样误差和调查成本,相对增加开头阶段的样本数,适当减少最后阶段的样本数。也就是说,在人力、经费和时间允许的情况下,可选择方案,4,、,5,。,C,考虑研究者所拥有的人力和经费,抽的区和学校越多,意味着所需的人力、经费和时间就越多。从这个方面考虑,则方案,9,最好,依次递减,方案,3,最差。,第三节 抽样调查的方法,二、,非概率抽样,依据研究者的主观愿望、判断、是否便利等因素来抽取样本。,第三节 抽样调查的方法,(一)方便抽样,1,、含义,方便抽样,:,研究者根据自己方便的形式抽取样本。,又称偶遇抽样。,例如,向街头行人询问物价的评价、在食堂调查大学生的月消费支出、在运动场向运动的人调查运动时间、在柜台访问顾客、利用客户名单进行调查以及在报纸上通过登函件进行调查等。,街头拦访,车友,汽车顾客满意度调查,第三节 抽样调查的方法,2,、方便抽样的优缺点,优点:简便易行、快速、费用低,缺点:样本代表性差,第三节 抽样调查的方法,3,、方便抽样的适用性,探索性调查,同质性强的总体,时效性要求较高的调查,流动性大的总体,第三节 抽样调查的方法,(二)判断抽样,1,、含义,判断抽样,:根据主观分析来选择、确定符合研究目标的样本。,又称主观抽样、目的抽样。,例如,调查客户评价可以重点调查核心客户的评价。对全国城市家庭平均消费支出的调查应该选择,3,口之家。,市场调查中,常用的典型调查、重点调查均属于此类抽样调查。,第三节 抽样调查的方法,2,、判断抽样的优缺点,优点:充分发挥研究人员的主观能动性,简便易行,缺点:受主观影响大,依赖研究人员的工作经验和判断能力,第三节 抽样调查的方法,3,、判断抽样的适用性,较大总体中某个容易辨认的次级集合,研究人员对总体情况比较熟悉,对总体中某类问题的研究,第三节 抽样调查的方法,(三)配额抽样,1,、含义,配额抽样,:根据某种标志分组,然后用判断抽样或方便抽样的方法抽取样本,并使拥有某种特征的样本单位比例与其在总体中的比例一致 。,又称定额抽样。,分层随机抽样,分层判断抽样,美国总统大选,第三节 抽样调查的方法,只要类型划分详细,那么同一类型中的每个个体都是同质的,因而无需采用随机抽样。,只要类型划分合理,且分配给各类型的名额符合总体中各类人员的分布,那么样本就可以准确地反映总体。,配额抽样的假设,第三节 抽样调查的方法,(,1,)独立控制的配额抽样,:这种方法只对具有某种特征的样本数规定配额,而对具有两种或两种以上特性的样本数则不作规定。,例,1,:控制特性为年龄、性别、收入三种,已经确定样本总数为,360,,按独立控制的配额抽样,则可列成如下三表,:,2,、分类,(三)配额抽样,年龄(岁),1834,20,3544,30,4560,40,61,岁以上,30,总计,120,性别,男,60,女,60,总计,120,收入,高,40,中,60,低,20,总计,120,(,A,),(,B,),(,C,),对独立控制的配额抽样的评价,具有调查员选择余地大、简便易行、费用少等优点。,但有时存在选择样本容易偏向某一类型而忽视其他类型的缺点。例如,问收入时偏向问男士。,调查不够深入。,(,2,)相互交叉控制配额抽样,含义:,又称为非独立控制配额。与独立控制配额抽样比较,不同在于样本要求同时具有交叉控制特征。规定被调查对象必须同时具有两种或两种以上特性并分配相应的调查数额。,相互交叉控制配额抽样方式的工作程序,1,)确定控制特性。,调查者可事先根据调查的目的和对象情况,确定调查对象的控制特性,作为总体的划分类别标准,如采用年龄、性别、收入、文化程度等作为消费者调查的控制特征。,2,)根据控制特征对总体进行分层,以各层个体数占总体的个体数计算出各层占被调查总体的比例。,3,)进行配额分配,确定每层的调查样本数量。,各类样本配额比例以各类单位在总体中所占比例为基础计算,然后再进行调整确定。,4,)由调查人员选择样本进行调查。,在各层抽样数目确定后,调查者就在确定的样本配额限度内按要求任意选择样本进行调查。,收入,性别,样本数目,年龄,高,中,低,总计,男,女,男,女,男,女,1834,3544,4560,61,以上,6,10,14,6,6,10,14,6,8,14,18,14,8,14,18,14,16,26,28,20,16,26,28,20,60,100,120,80,合计,36,36,54,54,90,90,360,总计,72,108,180,课堂练习:某工厂有,3000,名工人,男工占,30,,女工,70,,,30,岁以下的,60,,,30,40,岁的,30,,,40,岁以上的,10,,问如何采用,相互交叉控制配额抽样,的方法抽取一个规模为,300,人的样本?,男工(,90,人),女工 (,210,人),30,岁以下,30,40,岁,40,岁以上,30,岁以下,30,40,岁,40,岁以上,54,人,27,人,9,人,126,人,63,人,21,人,表,2 300,个人的定额样本分布表,1,),在配额分配过程中能兼顾各种类别,所以能做到调查面较广。,2,),调查的样本具有交叉的属性,所以样本的代表性较强,调查较深入。,相互交叉控制配额抽样方式的评价,配额抽样与分层随机抽样的比较,相似:,都要事先对总体中所有单位按其属性、特征分类;然后,按各个控制特性,分配样本额。,区别:,分层随机抽样是按随机原则在各层内抽取样本,而配额抽样则是由调查者在配额内主观判断选取样本。,配额抽样与判断抽样的比较,抽取样本的方式不同。,配额抽样是从总体各个控制特性层次中抽取若干样本;而判断抽样是从总体某一个层次中抽取若干符合条件要求的典型样本。,抽样样本本质要求不同。,配额抽样注重“数量”的分配;判断抽样则注重“性质”的分配。,抽样方法不同。,配额抽样方法(如相互控制配额)比较复杂精密;判断抽样方法简单易行。,3,、配额抽样的优缺点,优点:简便易行,快速,费用节省,调查结果可靠,应用性广,缺点:选择样本时易产生主观误差,4,、配额抽样的适用性,对总体有一定的了解,第三节 抽样调查的方法,(四)滚雪球抽样,1,、含义,滚雪球抽样,:,在调查时,要求受访者提供其他回答者的名单。,又称推荐抽样。,第三节 抽样调查的方法,滚雪球抽样示意图,第三节 抽样调查的方法,2,、滚雪球抽样的适用性,不清楚总体状况,难以获得抽样框,或抽样框中的样本数量有限,样本单位之间有一定联系,并愿意提供这种关系,驴友需求调查,某化妆品用户调查,第三节 抽样调查的方法,方便易行,多用于探索性研究,或研究总体边界不清,由于时间或经费等客观因素制约,无法实施概率抽样时,样本的代表性取决于研究者的认识能力、判断力、责任心及科学态度,抽样误差不可计量,第三节 抽样调查的方法,小结,非概率抽样,思考,如何选择抽样方法,研究性质,对抽样误差的要求程度,抽样误差与非抽样误差的相对大小,总体差异性的大小,经费、时间、抽样框获得性等的考虑,不同方法的灵活使用,第三节 抽样调查的方法,思考:,某大学进行学生上网情况调查,如何抽样?,第四节 确定样本容量,第四节 确定样本容量,一、样本容量,样本所含个体数量的,多少。,总体越大,样本容量越大吗?,样本容量最少需要满足多少数量?,从统计意义上看,选择多少样本容量比较合适?,成本因素如何在确定样本容量时得到体现?,第四节 确定样本容量,样本容量并不总与总体大小有关系,700,600,500,400,300,200,100,0,样本容量,(人),1000,2000,3000,4000,5000,10000,20000,50000,100000,500000,总体(人),置信水平,95%,置信区间,3%,总体差异性较大,1000 35%,2000 23%,3000 16%,4000 13%,5000 11%,10000 6%,20000 3,.2,%,50000 1,.3,%,100000 0,.68,%,总体数 样本占总体比例,第四节 确定样本容量,第四节 确定样本容量,资料分析上的要求,大样本(,30,以上),年龄,收入,35,岁以下,35-45岁,10000,元以下,10000,元以上,合计,8,2,10,15,14,2,5,10,12,45,岁以上,第四节 确定样本容量,样本容量与抽样误差成反比(研究要求),与总体差异性成正比,确定样本容量,n=(k* /e),2,公式说明:,e,样本的精确度,即抽样误差,反映样本统计值与总体参数值之间的差异。精确度高,则,e,小;反之则,e,大。,(,sigma,),总体的标准差,反映总体变量值分散的程度。,k,可信度系数,(,可信度即样本对总体的代表性程度)。当可信度,=99%,,,k=2.58,;,当可信度,=95%,,,k=1.96,。,第四节 确定样本容量,确定样本容量,n=(k* /e),2,第四节 确定样本容量,确定样本容量须综合考虑其他客观要求,调查经费,时间,样本接触难度,二、确定样本容量的常见方法,取决于研究人员对样本代表性强弱的主观判断,以及调研经费预算,样本一般取总体的,5%,10%,考虑废卷因素,追加,10%,的补充样本,(一)非概率抽样,第四节 确定样本容量,第四节 确定样本容量,若总体差异性较小:,小型调查:样本数,n50,大型调查:样本数,n100,若总体差异性较大:,小型调查:样本数,n400,大型调查:样本数,n1000,(二)概率抽样,第四节 确定样本容量,取决于研究精度、总体差异性和样本代表性,考虑经费、时间等因素,考虑废卷因素,追加,10%,的补充样本,例:,某地区居民有,10000,户,其年收入水平的标准差是,200,元。若拟采取抽样调查获知其年平均消费水平,要求以,95%,的可信度推断总体,其允许误差范围是,15,元。调研经费为,15000,元,调研成本单价为,20,元。则样本容量为:,n,1,=,(,k*,/e,),2,=,(,1.96*200/15,),2,=683,(,户),第四节 确定样本容量,n,2,=,15000,/20,=750,(,户),n,3,=,10000,*10%,=1000,(,户),概率抽样,非概率抽样,1.,定性因素,(,1,)决策的重要性,(,2,)调查类型,(,3,)变量个数,(,4,)数据分析的性质,(,5,)同类调查所用的样本量,(,6,)发生率(出现率),(,7,)完成率(回收率),(,8,)时间经费限制,三、确定样本容量的影响因素,2.,定量因素,(,1,)总体的差异程度,(,2,)允许误差的大小,(,3,)调查结果的可靠程度,(,4,)采用的抽样方法,第四节 确定样本容量,第五节 抽样误差,市场调查误差,第五节,抽样误差,1,调查误差,2,代表性误差,2,.1,系统性误差,2,.2,偶然误差,2,.2.1,实际误差,2,.2.2,平均误差,第五节 抽样误差,1,、调查误差:由于调查设计、收集、统计、汇总等产生的误差,2,、代表性误差:由于样本结构与总体结构不一致产生的误差,(只有抽样调查才有),一、相关概念,第五节 抽样误差,2,.,1,、系统性误差:在抽样过程中因违反随机抽样原则或抽样方式不妥造成的误差,(如抽样框误差,无回答误差,调查人员误差,受访者误差),2.2,、偶然误差:由于样本不能完全代表总体所产生的误差,(只有概率抽样才有),第五节 抽样误差,2,.,2,.,1,、实际误差:样本统计值与总体实际值之间的实际偏差,2.2.2,、平均误差:各种可能被抽中的样本统计值与总体参数值的可能相差的范围。它反映了样本代表性的大小。,总体,抽样框,计划样本,实际样本,抽样框误差,抽样误差,不回应偏差,第五节 抽样误差,第五节 抽样误差,总体的差异性程度,样本容量,抽样方式,二、抽样误差的影响因素,思考与练习,总体 样本 抽样框 抽样误差 抽样调查 概率抽样 非概率抽样 简单随机抽样 系统抽样 分层抽样 整群抽样 方便抽样 判断抽样 配额抽样 参考抽样 样本容量,一、术语解释,第七章 抽样设计,思考与练习,1,、在市场调研中为什么要进行抽样调查?,2,、如何理解抽样调查的优缺点?,3,、简述抽样设计的步骤。,4,、简述简单随机抽样方法的优缺点。,5,、分层抽样和整群抽样有什么区别?,6,、为什么说拦截访问属于非概率抽样调查方法?,7,、简述在确定样本容量时应考虑的影响因素。,二、思考题,第七章 抽样设计,本章结束,谢谢大家,!,
展开阅读全文