资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,样本设计,SAMPLE DESIGN,内容提要,1)抽样的基本步骤,2)非概率样本设计,3)概率样本设计,4)样本量的的确定,5)回答率问题,小案例,下表是某学院教师所生子女的性别分布情况,请问男、女教师子女的性别构成有何差异?,-,子女性别,父母性别-,男 女 合计 性别比,-,男 8 4 12 2.00,女 4 6 10 0.33,合计 12 10 22 1.20,-,一、抽样的基本概念,抽样(sampling)是根据一定的规则和程序,从研究总体中抽取其中的一部分样本的过程。,样本设计过程,1、定义总体,2、确定抽样框,3、确定抽样方法与技术,4、确定样本量,5、实施抽样过程,总体,总体(population)是按照内容、范围和时间三重标准定义的全部个体的集合。,目标总体(target population)是按照内容、范围和时间三重标准定义的全部个体的集合。,抽样总体(sampling population)从中实际抽取样本的所有个体的集合。,讨论:广州地铁顾客满意度研究的目标总体与抽样总体?,抽样框架,抽样框架(sampling frame)是抽样总体的可操作性定义。在编制抽样框架时常见的问题如下:,遗漏遗漏部分样本单位;,聚堆缺乏个体样本单位信息;,重复同一样本单位重复出现;,混杂抽样框架中包括部分非样本总体成员。,例:调查广州市所有的西饼店,用黄页的工商业名单作抽样框,过滤问题,为了确定某一个体是否属于抽样总体,常有必要使用过滤问题。,除了某项研究的特殊要求以外,营销研究通常要求研究对象:,过去3个月内没有接受任何产品或广告调查;,本人及家庭成员不在有关的公司工作。,例:(当代市场调研)表12-2,p240。,样本,样本(a sample)是从总体中抽取的、加以研究和度量的部分个体的集合。,样本单位(a sampling unit)为抽样总体中的基本成员单位。,统计指标(statistics)是总体参数的样本估计值。,例:当代商城顾客满意度研究,二、非概,率,率样本设,计,计,非概率样,本,本设计(nonprobability sample design)事先并,不,不确定每,个,个样本单,位,位被抽中,的,的概率。,这,这种样本,设,设计往往,无,无法排除,研,研究人员,偏,偏好对抽,样,样的影响,,,,也无法,估,估算样本,估,估计值的,抽,抽样误差,。,。,讨论:网,上,上消费者,调,调查的样,本,本设计,非概率样,本,本的应用,该方法通,常,常用于下,列,列情况:,样本量规,模,模很小时,;,;,探索性研,究,究或研究,的,的初始阶,段,段;,目标总体,成,成员很少,或,或很难寻,找,找;,无法采用,概,概率样本,时,时。,例:百事,可,可乐的免,费,费品尝促,销,销,非概率样,本,本的种类,方便样本(conveniencesample),选择容,易,易接触的,个,个体作为,调,调查研究,对,对象;,判断样本(judgmentalsample),根,根据研究,者,者的判断,,,,选择,有,有代表性或典,型,型性的,样,样本单位,;,;,定额样本(quotasample)将,总,总体分层并,确,确定每层应,抽,抽取的样本,量,量,让调查,员,员根据定额,抽,抽样;,滚雪球样本(snowballsample)先抽,取,取少量的样,本,本,然后通,过,过滚雪球的,方,方式扩大。,方便抽样(,任,任意抽样),例,在入户调查,中,中,调查员,选,选择家中有,人,人的住户;,没有认定被,调,调查者身份,的,的拦截式访,问,问;,利用客户的,名,名单进行调,查,查;,将问卷登在,宣,宣传媒体上,,,,被调查者,自,自填后寄回,。,。,特点,方便选样,样本的信息,不,不适用于总,体,体参数的推,断,断。,判断抽样,调研者(通,常,常是该领域,的,的专家)根,据,据主观经验,和,和判断,从,总,总体中选择,“,“平均”的,或,或认为有代,表,表性的同时,又,又容易取得,的,的个体作为,样,样本。,当总体变差,较,较大,而样,本,本容量又不,可,可能大时,,判,判断抽样有,可,可能比概率,抽,抽样提供更,为,为准确的估,计,计。,判断抽样的,精,精度主要取,决,决于抽样者,的,的经验,与,样,样本量关系,不,不大。,缺点是不能,获,获得估计值,的,的精度。,定额抽样,第一阶段,,给,给调查员指,定,定不同类型,的,的定额,例按性别、,年,年龄、职业,、,、收入等指,标,标确定每类,中,中的被调查,者,者定额。,第二阶段,,调,调查员按方,便,便抽样或判,断,断抽样选取,样,样本单位。,优点:不用,抽,抽样框,以,费,费用较低费,用,用获得与总,体,体特征分布,相,相似的样本,。,。,缺点:不能,获,获得估计的,精,精度。,滚雪球抽样,先选择一些,调,调查对象,,访,访问这些调,查,查者之后,,再,再请他们提,供,供另外一些,属,属于所研究,的,的目标总体,的,的调查对象,,,,对这些调,查,查对象调查,后,后,再由他,们,们按相同的,要,要求提供新,的,的调查对象,,,,将这种过,程,程不断继续,下,下去,直到,完,完成规定的,样,样本容量为,止,止。,适用于对稀,少,少群体的调,查,查(如私人,汽,汽车拥有者,),),优点:能有,效,效地找到符,合,合要求的被,调,调查者。,例:某市的,市,市民评议,某市政府为,了,了让市民对,各,各政府部门,工,工作给予评,估,估,决定在,地,地方报纸上,刊,刊登调查表,然后根,据,据寄回的调,查,查表对各部,门,门进行排名,。,。,请问这种做,法,法可能带来,哪,哪些问题?,三、概率样,本,本设计,概率样本设,计,计(probability sampledesign)采取,随,随机的办法,,,,排除研究,人,人员主观因,素,素的干扰,,使,使样本总体,中,中的每一个,成,成员都有一,个,个事先确定,好,好抽中概率,。,。,简单随机抽,样,样,系统抽样,分层抽样,整群抽样,简单随机抽,样,样,简单随机抽,样,样(simple randomsampling),是,是最基本,的,的概率抽样,方,方法。该抽,样,样方法保证,每,每一抽样单,位,位都有相同,的,的非零抽中,概,概率,并给,出,出总体参数,的,的自加权估,计,计值。,若,总,总,体,体,为,为N,,,,,样,样,本,本,量,量,为,为n,,,,,则,则,每,每,一,一,抽,抽,样,样,单,单,位,位,的,的,抽,抽,中,中,概,概,率,率,:,:,p=n/N,系,统,统,抽,抽,样,样,系,统,统,抽,抽,样,样(systematicsampling),是,是,随,随,机,机,抽,抽,取,取,第,第,一,一,个,个,样,样,本,本,单,单,位,位,,,,,然,然,后,后,每,每,隔,隔k,个,个,单,单,位,位,抽,抽,取,取,一,一,个,个,。,。,系,统,统,抽,抽,样,样,时,时,每,每,个,个,样,样,本,本,单,单,位,位,抽,抽,中,中,的,的,概,概,率,率,相,相,同,同,,,,,为,为1/k,,,,,通,通,过,过,系,系,统,统,抽,抽,样,样,也,也,可,可,获,获,得,得,总,总,体,体,参,参,数,数,的,的,自,自,加,加,权,权,估,估,计,计,值,值,。,。,讨论,:,:什,么,么时,候,候应,避,避免,采,采用,系,系统,抽,抽样,?,?,分层,抽,抽样,分层,抽,抽样(stratifiedsampling)时,将,将总,体,体按,某,某些,重,重要,特,特征,分,分为,数,数个,层,层,,各,各层,之,之间,既,既不,能,能有,重,重复,也,也不,能,能有,遗,遗漏,,,,然,后,后用,简,简单,随,随机,抽,抽样,或,或系,统,统抽,样,样的,办,办法,从,从每,层,层中,抽,抽取,一,一定,数,数量,的,的样,本,本。,比例,分,分层,抽,抽样,非比,例,例分,层,层抽,样,样,讨论,如果,某,某校,有,有1000名,本,本科,生,生,200名,普,普通,硕,硕士,生,生和300名MBA学,生,生,,若,若要,比,比较,不,不同,学,学生,之,之间,的,的平,均,均可,支,支配,收,收入,,,,应,采,采用,哪,哪种,抽,抽样,方,方法,?,?其,总,总的,平,平均,收,收入,应,应如,何,何计,算,算?,整群,抽,抽样,整群,抽,抽样(clustersampling),是,是将,总,总体,分,分为,不,不同,的,的群,组,组,,然,然后,随,随机,抽,抽取,一,一定,数,数量,的,的群,组,组作,为,为样,本,本。,整,整群,抽,抽样,可,可分,为,为:,一级,整,整群,抽,抽样,在,抽,抽中,群,群组,中,中抽,取,取所,有,有个,体,体;,二级,整,整群,抽,抽样,在,抽,抽中,群,群组,中,中抽,取,取部,分,分个,体,体。,多级,抽,抽样,将,总,总体,分,分为,多,多级,群,群组,,,,逐,级,级抽,样,样。,样本设计,的,的选择,影,响,响,样,样,本,本,设,设,计,计,的,的,因,因,素,素,主,主,要,要,有,有,:,:,研,究,究,所,所,处,处,的,的,阶,阶,段,段,和,和,数,数,据,据,的,的,用,用,途,途,;,;,总,体,体,内,内,部,部,的,的,同,同,质,质,性,性,;,;,时,间,间,、,、,经,经,费,费,和,和,人,人,力,力,;,;,数,据,据,收,收,集,集,的,的,方,方,法,法,;,;,其,它,它,实,实,际,际,考,考,虑,虑,。,。,四,、,、,确,确,定,定,样,样,本,本,量,量,的,的,经,经,验,验,方,方,法,法,最,简,简,单,单,的,的,方,方,法,法,是,是,根,根,据,据,研,研,究,究,的,的,类,类,型,型,和,和,经,经,验,验,,,,,以,以,及,及,以,以,下,下,因,因,素,素,确,确,定,定,样,样,本,本,量,量,:,:,决,策,策,的,的,重,重,要,要,性,性,;,;,研,究,究,的,的,性,性,质,质,;,;,单,位,位,成,成,本,本,;,;,发,生,生,率,率,和,和,完,完,成,成,率,率,;,;,其它。,可支配预算,法,法,根据进行某,项,项研究可支,配,配的预算,,在,在扣除其他,支,支出后,按,单,单位样本的,成,成本决定样,本,本量。,例:进行某,项,项研究的总,预,预算是50,000元,,,,研究设计,、,、人员培训,、,、问卷测试,和,和数据分析,等,等其它费用,共,共需10,000元,,完,完成每份调,查,查问卷(含,数,数据录入),的,的平均费用,是,是50元,,请,请问可以抽,取,取多大的样,本,本?,确定样本量,的,的统计学方,法,法,对于概率样,本,本可用统计,公,公式计算所,需,需样本。这,时,时样本量与,下,下列因素有,关,关:,样本设计类,型,型;,要求的精度,;,;,总体内部的,同,同质性;,分组的详细,程,程度。,估计均值时,样,样本量的确,定,定,对于简单随,机,机抽样:,1.确定,允,允许误差D,,,,d=,$5.00,2.确定,置,置信水平CL,CL=95%,3.确定,与,与置信水平,相,相应的z值,,,,z=1.96,4.确定,总,总体的标准,差,差s,s=55,5.计算,所,所需样本量n,n=s,2,z,2,/d,2,=465,6.当样,本,本量超过总,体,体的5%时,,,,,n,c,=nN/(N+n-1),估计比例时,样,样本量的确,定,定,对于简单随,机,机抽样:,1.确定,允,允许误差D,,,,d=,.05,2.确定,置,置信水平CL,CL=95%,3.确定,与,与置信水平,相,相应的z值,,,,z=1.96,4.估计,总,总体的发生,率,率P,P=0.64?,5.计算,所,所需样本量n,n=P(1-P)z,2,/d,2,=355,6.当样
展开阅读全文