第七章L4样本设计课件

上传人:沈*** 文档编号:241663013 上传时间:2024-07-14 格式:PPT 页数:46 大小:668KB
返回 下载 相关 举报
第七章L4样本设计课件_第1页
第1页 / 共46页
第七章L4样本设计课件_第2页
第2页 / 共46页
第七章L4样本设计课件_第3页
第3页 / 共46页
点击查看更多>>
资源描述
第第 七七 章章样 本本 设 计 .l第一第一节 样本本设计概述概述 l第二第二节 抽抽样技技术 l第三第三节 样本容量本容量 本章主要内容本章主要内容.l掌握样本和抽样 的基本概念、开 发样本计划的程序 l掌握概率抽样和非概率抽样技术l了解样本容量的计算方法 本章学习目的本章学习目的.第一第一节 样本本设计概述概述 (一一)总体总体(population)总总体体:由市场研究项目的目标明确规定的整个研究对象的集合。或总总体体是指所要调查的对象的全体,是由所研究范围内具有某种共同性质的全体单位所组成的集合体。组成总体的每一个单位,叫总体单位或个体。(二二)样样本和本和样样本本单单位位 样样本本(sample):是总体的一个子集,它应具有对总体的代表性。或样样本本是从总体中按随机原则抽出的一部分单位组成的集合体。样样本本单单位位(sample unit),是组成样本的基本单位。一、样本和抽样一、样本和抽样.(三三)普查普查(census)普查普查是一种完整总体的说明。是指对目标总体的每一个单位进行逐一的、普遍的、全面的调查。市场普查可以获得全面的、准确的信息资料。适用于不经常进行调查领域的信息资料收集。l普查的局限性:耗费时间长,资料的时效性差;费用昂贵,耗费大量人、财、物 抽样调查抽样调查是按照一定的规则从总体中抽取一部分个体单位作为样本,通过对样本的调查研究所获得的信息资料,来推断总体的信息资料的方法。抽样调查也称抽样推断抽样调查也称抽样推断。l抽样调查具有如下一些优点:费用低、速度快、应用范围广、准确度高 .(四四)抽样误差抽样误差(sampling error)抽样误差,抽样误差,是在调查中因使用样本而发生的任何误差。或或抽样误差,抽样误差,是指样本指标与总体指标之间的平均离差。抽样误差由以下因素引起:抽样方法(样本选择的方法);样本容量。一些抽样方法可将抽样误差减少到最小程度,而有些抽样方法则对误差没有任何控制。被研究总体各标志值的差异程度。.(五五)抽样框和抽样框误差抽样框和抽样框误差 抽抽样样框框(sample frame)是总体中所有样本单位的完整列表。抽抽样样框框误误差差是抽样框不能解释总体的程度。观测抽样框误差的一个方法是通过对列表与总体的对比,来观察抽样框在多大程度上与目标总体充分一致。抽样框误差主要来自两方面:总体一部分成员不在抽样框内;抽样框内一部分成员不属于目标总体。总体抽样框.二、抽样的原因二、抽样的原因 主要有两个原因使抽样比普查更可取。(1)普查的成本非常昂贵,并且耗时很长。(2)在某些情况下,普查是不可行的。.三、开发样本计划的程序三、开发样本计划的程序(样本设计过程)(一一)定义总体定义总体 即要明确或确定总体。抽样阶段的开始,相关总体必须明确化。总体的明确化涉及到将目标总体用具体的人口统计学特征或其他特征来描述,这些特征能将目标总体与其他总体区分开来。要求研究者以对受访者类型的精确描述来指明样本单位。总体必须得到正确而且精确的定义,因为如果总体定义错误可能会导致整个市场研究项目的失败。.同质总体可以从以下几方面进行描述或定义:地域特征;人口统计特征;产品或服务使用情况;认知程度等。在调研中,问卷开始的过滤性问题,可以识别出某个个体是否属于同质总体。为了确定总体中包括哪些人,通常情况下,重要的是确定那些应排除在外的人的特征。样本单位,就是抽样的基本单元,有时是个人,有时是家庭,有时是公司等。.(二二)识别抽样框识别抽样框 一旦定义了相关总体,研究人员就以一个合适的列表作为抽样框开始进行市场研究。抽样框是指是总体中所有样本单位的完整列表。抽样框被定义为总体的数据目录或单位的名单,从中可以抽出样本单位。完整的抽样框中,每个调研对象应该出现一次,而且只能出现一次。理想的情况是,我们有一个完整和准确的名单 完整的抽样框可能是不存在的抽样框的不完整,往往会导致抽样框误差的产生大多数列表存在抽样框误差,或者一些总体成员未列入列表,或者列表列入了一些非总体成员。.研究人员的任务不是寻找毫无误差的抽样框,而是以合理的成本寻求误差最小的抽样框。评估抽样框误差的关键在于两个因素:判断列入抽样框中的人哪些不属于总体;通过访问开始时的筛选,可以识别出与总体定义不符者。抽样框中属于总体成员的人数占抽样框总人数的百分比称为关联率。估计总体中哪几类人未列入抽样框中。如果没有列入表内的总体成员对最终样本没有不利影响,则可判断抽样框误差程度是可以接受的。选择抽样框的标准是:关联率较高,未列入抽样框中的总体成员对抽样结果影响不大。.(三三)设计抽样(样本)计划设计抽样(样本)计划(方法、容量方法、容量)在本步骤中,研究人员开始综合考虑样本设计、数据收集成本和样本容量(sample size)。抽样方法,可以分为两大类:随机抽样与非随机抽样。选择哪种抽样方法取决于研究目的、经济实力、时间限制、调查问题的性质等。抽样设计作为调研设计的有机组成部分,总是根据调研方法的不同而采取不同的抽样技术。确定样本容量(抽选多少个调查对象)如何合理地、经济地确定一个抽样数目,使之既满足抽样误差的要求,又能使抽样调查所需成本费用尽量最小。样本容量的确定原则是控制在必要的最低限度。.(四四)抽取样本,收集数据抽取样本,收集数据 本步骤分为两个阶段:首先应选择组成样本的元素;其次,从这个元素中获取信息。简单地说,你需要选择一个元素然后询问他一些问题。然而,不是每个人都愿意回答,所以出现了替代的问题。三种替代方法:舍弃(顺移替换 drop-down substitution)过多抽样(oversampling)再抽样(resampling).(五五)样本有效性检验样本有效性检验 样本有效性检验有多种形式,其中之一是将样本的人口统计轮廓与已知的档案材料(如人口普查资料)进行比较,看看这个样本是不是总体的代表。样本有效性检验的实质是向客户做出保证,这个样本是决策者希望对其做出决策的总体的具有代表性的样本。(六六)必要时再抽样必要时再抽样 当样本有效性检验失败时,意味着它不能充分代表总体。必要时可以执行再抽样,以便选择更多的受访者加入样本,达到一个令人满意的有效化水平。.第二第二节 抽抽样技技术 抽样技术可以归为两大类别:概率抽样和非概率抽样。概概率率抽抽样样(probability samples):又称随随机机抽抽样样,即总体的每个成员有一个已知的、非零的机会被选入样本中,总体的每个成员选入样本的机会可以不等,但是每个成员有一个已知的选入概率。.概率抽样优点:概率抽样优点:样本可均匀地分布于总体中,从而保证样本对总体的代表性。能估算出抽样误差。调查结果可以用来推断总体。缺点:缺点:对抽样设计技术和抽样实施过程的控制要求高费用高 时间长 .非概率抽样非概率抽样(nonprobability samples):即总体的成员选为样本的概率是未知的。没有办法估计任何总体元素被选入样本的概率。因此,非概率抽样无法保证样本是总体的代表。所有的非概率抽样依赖于样本选择过程中的个人判断,这些判断即使有时可能得到关于总体特征的良好估计,也没有办法客观判定样本是否充分。非概率抽样优点:非概率抽样优点:费用低时间少 缺点:缺点:不能估算抽样误差不知抽样指标代表总体指标的程度.一、概率抽样一、概率抽样 概率抽样主要存在四种方法:简单随机抽样、系统抽样、整群抽样和分层抽样。(一一)简单随机抽样简单随机抽样 简单随机抽样(simple random sampling),又称单纯随机抽样:对于总体的所有成员,选入样本的概率是已知的和相等的。它按照随机的原则从调查总体中不加任何分类、排序、分组等先行工作,直接地抽取调查样本单位。各单位被抽到的机会完全均等,相互独立,排除了抽样过程中各种主观因素的干扰。可以下式表达:选择的概率=样本容量/总体容量 .例:总体单位数为10000,样本单位为400,那么抽样概率为400/100004%简单随机抽样的方法:包括“抽签法”和随机数表法。7029171213566218373599465722771608150472311693324340332038269683508775884295457233271434095027898719.应用方法:首先要把调查总体中的所有单位予以编号,根据编号的位数确定使用若干位数字,然后查乱数表。以乱数表中任一行或一列的数字作为开始数,接着可从上而下,或从左到右,或一定间隔顺序取数,凡编号范围内的数字号码即为被抽取的样本。.简单随机抽样的优点优点:1.这种抽样方法保证总体的每个成员都有一个已知和相等的可能性被选入样本,因此得到的样本不管容量是多大,都将是总体的一个有效代表。2.这种抽样方法很简单,并且保证每个总体单位在抽选时都有相等的被抽中机会。缺点缺点:这种抽样方法需要预先确定每个总体成员,且需为每个总体成员提供唯一标志。.(二二)系统抽样系统抽样(systematic sampling)系统抽样系统抽样又称机械抽样机械抽样或等距抽样等距抽样。它是先将总体各单位按照某一标志排列,然后根据一定的抽样距离从总体中抽取样本。系统抽样既可以属于随机抽样,也可以属于非随机抽样,其关键在于第一个样本的抽取方式。与简单随机抽样一样,使用系统抽样,必须获得总体的列表。然而,不必将名字、号码或任何别的标志转录到纸上或计算机文件中。相反,研究人员决定一个“跳跃区间(抽样距离)”,将列表中名字的个数除以样本容量就得到跳跃区间。跳跃区间=总体容量/样本容量.应用程序:应用程序:按一定标志把总体中的个体按顺序排列,确定起始抽号数,即抽样起点。根据总体单位数和样本单位数计算出抽样距离(即相同的间隔),按相同的距离或间隔抽选样本单位。特点:特点:等距抽样技术相对于简单随机技术最主要的优势就是经济性。它比简单随机抽样更为简便,花的时间更少,并且花费也少。最大的缺点在于总体单位的排列上。.(三三)整群抽样整群抽样(cluster sampling)整群抽样(整群抽样(分群抽样)分群抽样)是先将市场调查的总体划分为若干个群体,然后以简单随机抽样的方法选取部分群体作为调查样本,对群体内各个单位进行调查的一种随机抽样方法。整群抽样中,总体被分为子集合,每一个子集合都可代表整个总体。因此,任何一个群都将是总体的令人满意的代表。整群抽样适用于调查总体单位分布较分散并且无法确定分层标准的大总体。当调查总体相当大时,可以进行逐级分群,一直进行到单个群体的数目足够小时为止,然后从所有的群中随机抽取一定的群作为调查对象实施调查。分群抽样对总体推断的准确性较差。因而往往与其它方法相结合使用。.在地地区区抽抽样样中,市场研究人员将调查的总体划分成地区,例如人口普查区、城市、邻近地区或其他任何方便的和可识别的地理标识。研究人员这时有两个选择:一一步步法法或两步法。或两步法。一一步步法法:研究者可以相信不同的地理区域足够相似,这样,可以将注意力集中于一个地区,把结论推广到整个总体。但是研究者需要随机选择这个地区,对它的成员执行一次普查。两两步步法法:第一步,研究者在这些地区中选择一个随机样本;第二步,研究者在选中的这些地区中确定一个概率方法进行抽样。.n划分群时,每群的单位数可以相等,也可以不等,在每一群中的具体抽选方式,既可以采用简单随机的方式,也可以采用等距抽样的方式,但不管什么方式,都只能用不重复的抽样方法。优点:抽取样本比较简单方便,抽中的单位比较集中。缺点:由于样本单位集中在某些群体,而不能均匀分布在总体中,如果群体之间差异较大或每群中单位的特征非常相似,则抽样误差就会增大。.(四四)分层抽样分层抽样(stratified sampling)分层随机抽样,又称为分类随机抽样,是把调查总体按其属性不同分为若干层次,然后在各层中随机抽取样本。包含下列两个步骤:(1)总体被分为相互排斥和尽举的子集;(2)从每个组或子集中独立地选择一个简单随机样本。全部元素所分入的子集称为层层或分分总总体体。注意:这个划分必须是相互排斥或尽举的。分层抽样,相对于简单随机抽样,其抽样误差更小。分层允许对感兴趣的特定集合的特征进行调查。.n分层抽样在操作上主要的问题是总体的样本怎样向各分层群体分配。常用的分配方法有比例分配和非比例分配两种,称比例分层抽样和非比例分层抽样。n比例分层抽样是指按某分层群体中个体的数量占总体数量的比例向这个分层群体分配样本数量。这种方法适用于分层后分层群体内部差异显著较小的分层随机抽样。n非比例分层抽样是指不按某分层群体中个体的数量占总体数量的比例向这个分层群体分配样本数量,而按照其他权重分配样本数量。常用的其他权重是某分层群体的标准离差占各分层群体标准离差总和之比。.二、非概率抽样二、非概率抽样 非概率抽样,是指根据一定主观标准来抽选样本的抽样技术,总体中每一个个体不具有被平等抽取的机会。主要有四种非概率抽样方法:v方便抽样v判断抽样v参考抽样v配额抽样 .(一一)方便抽样方便抽样(convenience samples)方便抽样(便利抽样),又称为偶然抽样、任意抽样,因为组成样本的元素以“偶然”的方式进入它们碰巧出现在收集研究所需信息的地方。方便抽样,是根据调查者的方便与否来抽取样本的一种抽样方法。“街头拦人法”和“空间抽样法”是方便抽样的两种最常见的方法。“街头拦人法”是在街上或路口任意找某个行人,将其作为被调查者进行调查。“空间抽样法”是对某一聚集的人群,从空间的不同方向和方位对他们进行抽样调查。常见类型:街头随访或拦截访问、邮寄调查、杂志内问卷调查、网上调查。.q方便抽样优、缺点方便抽样简便易行,能及时取得所需的信息资料,省时、省力、节约经费。抽样偏差较大,一般用于非正式的探测性调查,只有在调查总体各单位之间的差异不大时,抽取的样本才具有较高的代表性。.(二二)判断抽样判断抽样(judgment samples)判断抽样,是凭调查人员的主观意愿、经验和知识,从总体中选择具有代表性的样本作为调查对象的一种抽样方法。判断抽样选取样本单位的方法:一般选择最能代表普遍情况的调查对象,常以“平均型”或“多数型”为标准,应尽量避免选择“极端型”。选取“平均型”样本单位:代表平均水平 选取“多数型”样本单位:能反映大多数单位的情况 判断抽样,经常称为目的抽样。精心挑选样本元素是希望它们能服务于研究目的。最典型的情况是,选择样本元素的原因是相信它们是存在兴趣的总体的代表。.q判断抽样优缺点n判断抽样方法在样本规模小及样本不易分门别类挑选时有其较大的优越性。n但由于其精确性依赖于调查者对调查对象的了解程度、判断水平和对结果的解释情况,所以判断抽样方法的结果的客观性受到人们的怀疑。.(三三)参考抽样参考抽样(referral samples,snowball samples)参考抽样中的参考样本,有时称为“雪球样本”,即要求受访者提供另外的受访者的名字,样本就像滚下山的雪球一样越来越大。又称推荐抽样,滚雪球抽样。当研究者的样本元素的列表小于对于研究所预期的总数量时,就开始这个添加列表的过程。在访问每位受访者后,他或她就询问其他可能的受访者的名字。利用这种方式,更多的受访者为先前的受访者所提及。就像这种样本的别名所暗示的,样本就像滚下山的雪球一样越来越大。.q参考抽样优、缺点当调查人员掌握较少样本资料的时候,而回答者又能提供对调查者可能有用的别的回答者名单时,参考抽样是最合适的。但参考抽样的代表性受到限制。.(四四)配额抽样配额抽样(quota samples)配额抽样:使样本中拥有某种特征的元素比例与该类元素在总体中的比例一致,以此来试图成为总体的代表。配额抽样是非随机抽样中最流行的一种,配额抽样是首先将总体中的所有单位按一定的标志分为若干类(组),然后在每一类(组)中用便利抽样或判断抽样方法选取样本单位。所不同的是,配额抽样不遵循随机原则,而是主观地确定对象分配比例。.常见类型:独立控制配额抽样、相互控制配额抽样。常见类型:独立控制配额抽样、相互控制配额抽样。(1)独立控制配额抽样:是对调查对象只规定具有一种控制)独立控制配额抽样:是对调查对象只规定具有一种控制特征的样本抽取数目并规定配额。特征的样本抽取数目并规定配额。例例:对对某某乡乡居居民民按按年年收收入入水水平平分分类类抽抽取取样样本本400户户,其其各各类类比重和样本单位数量在各类的分配如下:比重和样本单位数量在各类的分配如下:按人均年收入按人均年收入分类分类500元及以元及以下下5001000元元1000元以元以上上合计合计总体中各类户总体中各类户数比重数比重10%75%15%100%各类中样本单各类中样本单位数位数4030060400.l分别按照收入水平、年龄与性别进行的独立控制配额抽样的样本分布收入水平年龄性别高10050以上50男50中7025-50100女150低3025以下50-合计200合计200合计200.(2)相互控制配额抽样:是同时对具有两种或两种以上控制)相互控制配额抽样:是同时对具有两种或两种以上控制特征的每一样本数目都做出具体规定。特征的每一样本数目都做出具体规定。例例:样样本本总总数数400户户,其其中中:收收入入低低中中高高分分别别为为40、300、60户户;在在收收入入低低中中高高的的家家庭庭中中人人数数在在3人人以以下下的的家家庭庭数数分分别别为为12、88、16,则可列出交叉列表:,则可列出交叉列表:人数人数收入收入500元及以元及以下下5001000元元1000元以元以上上合计合计3人以下人以下1288161163人及以上人及以上2821244284合计合计4030060400.l以年龄、性别与收入水平作为交叉控制因素进行配额抽样的样本配额分布收入水平高中低合计性别男女男女男女年龄50以上619413265025-50133792631210025以下6195132550合计25751852723200合计1007030.q配额抽样优缺点配额抽样方法简单易行,可以保证总体的各个类别都能包括在所抽样本之中,因此配额抽样的样本具有较高的代表性。但也应注意到这种方法具有一定的假设性,即假定具有某种相同特征的调查对象,其行为、态度与反应都基本一致。因此,对同一层内的调查对象,是否采取随机抽样就无关紧要了。由于抽样误差不大,只要问卷设计合理、分析方法正确,所得的结果同样值得信赖。而这种假设性是否得以成立,在很大程度上取决于调查者的知识、水平和经验。.某市政府为了让市民对各政府部门工作某市政府为了让市民对各政府部门工作给予评估,决定在地方报纸上刊登调查给予评估,决定在地方报纸上刊登调查表表,然后根据寄回的调查表对各部门进行然后根据寄回的调查表对各部门进行排名。排名。请问这种做法可能带来哪些问题?请问这种做法可能带来哪些问题?课堂讨论课堂讨论:某市的市民评议某市的市民评议.1.如果联想电脑公司委托你开展一项笔记本电如果联想电脑公司委托你开展一项笔记本电脑顾客满意度调查,请确定:脑顾客满意度调查,请确定:a.目标总体?目标总体?b.抽样单位和抽样框?抽样单位和抽样框?d.抽样方法及注意事项?抽样方法及注意事项?2.假如估计满意的顾客比率可能为假如估计满意的顾客比率可能为70%,回答,回答率大约为率大约为70%,要求有,要求有95%的把握保证满意率的把握保证满意率的误差不超过的误差不超过5个百分点,个百分点,请计算需要抽取的请计算需要抽取的样本量。样本量。课堂讨论课堂讨论.一、样本容量与样本代表性和精确度之间的关系 二、简单随机抽样下的样本容量 三、分层抽样下的样本容量 第第三三节 样本容量样本容量 .THE END.
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!