资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,样本设计,SAMPLE DESIGN,样本设计 SAMPLE DESIGN,1,内容提要,1)抽样的基本步骤,2)非概率样本设计,3)概率样本设计,4)样本量的的确定,5)回答率问题,内容提要1)抽样的基本步骤,2,小案例,下表是某学院教师所生子女的性别分布情况,请问男、女教师子女的性别构成有何差异?,-,子女性别,父母性别-,男 女 合计 性别比,-,男 8 4 12 2.00,女 4 6 10 0.33,合计 12 10 22 1.20,-,小案例 下表是某学院教师所生子女的性别分布情况,请问男,3,一、抽样的基本概念,抽样(sampling)是根据一定的规则和程序,从研究总体中抽取其中的一部分样本的过程。,一、抽样的基本概念,4,样本设计过程,1、定义总体,2、确定抽样框,3、确定抽样方法与技术,4、确定样本量,5、实施抽样过程,样本设计过程1、定义总体,5,总体,总体(population)是按照内容、范围和时间三重标准定义的全部个体的集合。,目标总体(target population)是按照内容、范围和时间三重标准定义的全部个体的集合。,抽样总体(sampling population)从中实际抽取样本的所有个体的集合。,讨论:广州地铁顾客满意度研究的目标总体与抽样总体?,总体总体(population)是按照内容、范围和时间三重标,6,抽样框架,抽样框架(sampling frame)是抽样总体的可操作性定义。在编制抽样框架时常见的问题如下:,遗漏遗漏部分样本单位;,聚堆缺乏个体样本单位信息;,重复同一样本单位重复出现;,混杂抽样框架中包括部分非样本总体成员。,例:调查广州市所有的西饼店,用黄页的工商业名单作抽样框,抽样框架抽样框架(sampling frame)是抽样总体的,7,过滤问题,为了确定某一个体是否属于抽样总体,常有必要使用过滤问题。,除了某项研究的特殊要求以外,营销研究通常要求研究对象:,过去3个月内没有接受任何产品或广告调查;,本人及家庭成员不在有关的公司工作。,例:(当代市场调研)表12-2,p240。,过滤问题为了确定某一个体是否属于抽样总体,常有必要使用过滤问,8,样本,样本(a sample)是从总体中抽取的、加以研究和度量的部分个体的集合。,样本单位(a sampling unit)为抽样总体中的基本成员单位。,统计指标(statistics)是总体参数的样本估计值。,例:当代商城顾客满意度研究,样本样本(a sample)是从总体中抽取的、加以研究和度量,9,10,二、非概率样本设计,非概率样本设计(nonprobability sample design)事先并不确定每个样本单位被抽中的概率。这种样本设计往往无法排除研究人员偏好对抽样的影响,也无法估算样本估计值的抽样误差。,讨论:网上消费者调查的样本设计,二、非概率样本设计非概率样本设计(nonprobabilit,11,非概率样本的应用,该方法通常用于下列情况:,样本量规模很小时;,探索性研究或研究的初始阶段;,目标总体成员很少或很难寻找;,无法采用概率样本时。,例:百事可乐的免费品尝促销,非概率样本的应用该方法通常用于下列情况:,12,非概率样本的种类,方便样本(convenience sample)选择容易接触的个体作为调查研究对象;,判断样本(judgmental sample)根据研究者的判断,选择有代表性或典型性的样本单位;,定额样本(quota sample)将总体分层并确定每层应抽取的样本量,让调查员根据定额抽样;,滚雪球样本(snowball sample)先抽取少量的样本,然后通过滚雪球的方式扩大。,非概率样本的种类方便样本(convenience sampl,13,方便抽样(任意抽样),例,在入户调查中,调查员选择家中有人的住户;,没有认定被调查者身份的拦截式访问;,利用客户的名单进行调查;,将问卷登在宣传媒体上,被调查者自填后寄回。,特点,方便选样,样本的信息不适用于总体参数的推断。,方便抽样(任意抽样)例,14,判断抽样,调研者(通常是该领域的专家)根据主观经验和判断,从总体中选择“平均”的或认为有代表性的同时又容易取得的个体作为样本。,当总体变差较大,而样本容量又不可能大时,判断抽样有可能比概率抽样提供更为准确的估计。,判断抽样的精度主要取决于抽样者的经验,与样本量关系不大。,缺点是不能获得估计值的精度。,判断抽样调研者(通常是该领域的专家)根据主观经验和判断,从总,15,定额抽样,第一阶段,给调查员指定不同类型的定额,例按性别、年龄、职业、收入等指标确定每类中的被调查者定额。,第二阶段,调查员按方便抽样或判断抽样选取样本单位。,优点:不用抽样框,以费用较低费用获得与总体特征分布相似的样本。,缺点:不能获得估计的精度。,定额抽样第一阶段,给调查员指定不同类型的定额,16,滚雪球抽样,先选择一些调查对象,访问这些调查者之后,再请他们提供另外一些属于所研究的目标总体的调查对象,对这些调查对象调查后,再由他们按相同的要求提供新的调查对象,将这种过程不断继续下去,直到完成规定的样本容量为止。,适用于对稀少群体的调查(如私人汽车拥有者),优点:能有效地找到符合要求的被调查者。,滚雪球抽样先选择一些调查对象,访问这些调查者之后,再请他们提,17,例:某市的市民评议,某市政府为了让市民对各政府部门工作给予评估,决定在地方报纸上刊登调查表,然后根据寄回的调查表对各部门进行排名。,请问这种做法可能带来哪些问题?,例:某市的市民评议某市政府为了让市民对各政府部门工作给予评估,18,三、概率样本设计,概率样本设计(probability sample design)采取随机的办法,排除研究人员主观因素的干扰,使样本总体中的每一个成员都有一个事先确定好抽中概率。,简单随机抽样,系统抽样,分层抽样,整群抽样,三、概率样本设计概率样本设计(probability sam,19,简单随机抽样,简单随机抽样(simple random sampling)是最基本的概率抽样方法。该抽样方法保证每一抽样单位都有相同的非零抽中概率,并给出总体参数的自加权估计值。,若总体为N,样本量为n,则每一抽样单位的抽中概率:,p=n/N,简单随机抽样简单随机抽样(simple random sam,20,系统抽样,系统抽样(systematic sampling)是随机抽取第一个样本单位,然后每隔k个单位抽取一个。,系统抽样时每个样本单位抽中的概率相同,为1/k,通过系统抽样也可获得总体参数的自加权估计值。,讨论:什么时候应避免采用系统抽样?,系统抽样系统抽样(systematic sampling)是,21,分层抽样,分层抽样(stratified sampling)时将总体按某些重要特征分为数个层,各层之间既不能有重复也不能有遗漏,然后用简单随机抽样或系统抽样的办法从每层中抽取一定数量的样本。,比例分层抽样,非比例分层抽样,分层抽样分层抽样(stratified sampling)时,22,讨论,如果某校有1000名本科生,200名普通硕士生和300名MBA学生,若要比较不同学生之间的平均可支配收入,应采用哪种抽样方法?其总的平均收入应如何计算?,讨论如果某校有1000名本科生,200名普通硕士生和300名,23,整群抽样,整群抽样(cluster sampling)是将总体分为不同的群组,然后随机抽取一定数量的群组作为样本。整群抽样可分为:,一级整群抽样在抽中群组中抽取所有个体;,二级整群抽样在抽中群组中抽取部分个体。,多级抽样将总体分为多级群组,逐级抽样。,整群抽样整群抽样(cluster sampling)是将总体,24,样本设计的选择,影响样本设计的因素主要有:,研究所处的阶段和数据的用途;,总体内部的同质性;,时间、经费和人力;,数据收集的方法;,其它实际考虑。,样本设计的选择影响样本设计的因素主要有:,25,四、确定样本量的经验方法,最简单的方法是根据研究的类型和经验,以及以下因素确定样本量:,决策的重要性;,研究的性质;,单位成本;,发生率和完成率;,其它。,四、确定样本量的经验方法最简单的方法是根据研究的类型和经验,,26,可支配预算法,根据进行某项研究可支配的预算,在扣除其他支出后,按单位样本的成本决定样本量。,例:进行某项研究的总预算是50,000元,研究设计、人员培训、问卷测试和数据分析等其它费用共需10,000元,完成每份调查问卷(含数据录入)的平均费用是50元,请问可以抽取多大的样本?,可支配预算法根据进行某项研究可支配的预算,在扣除其他支出后,,27,28,确定样本量的统计学方法,对于概率样本可用统计公式计算所需样本。这时样本量与下列因素有关:,样本设计类型;,要求的精度;,总体内部的同质性;,分组的详细程度。,确定样本量的统计学方法对于概率样本可用统计公式计算所需样本。,29,估计均值时样本量的确定,对于简单随机抽样:,1.确定允许误差D,d=$5.00,2.确定置信水平CL,CL=95%,3.确定与置信水平相应的z值,z=1.96,4.确定总体的标准差s,s=55,5.计算所需样本量n,n=s,2,z,2,/d,2,=465,6.当样本量超过总体的5%时,,n,c,=nN/(N+n-1),估计均值时样本量的确定对于简单随机抽样:,30,估计比例时样本量的确定,对于简单随机抽样:,1.确定允许误差D,d=.05,2.确定置信水平CL,CL=95%,3.确定与置信水平相应的z值,z=1.96,4.估计总体的发生率P,P=0.64?,5.计算所需样本量n,n=P(1-P)z,2,/d,2,=355,6.当样本量超过总体的5%时,n,c,=nN/(N+n-1),估计比例时样本量的确定对于简单随机抽样:,31,32,五、不回答问题,由于拒答、度量误差、数据处理误差等因素,常常产生非抽样误差。在研究中除了抽样误差以外,还应注意尽量减少非抽样误差。,五、不回答问题,33,34,35,课堂讨论,1.如果联想电脑公司委托你开展一项笔记本电脑顾客满意度调查,请确定:,a.目标总体和抽样总体?,b.抽样单位和抽样框架?,d.抽样方法及注意事项?,2.假如估计满意的顾客比率可能为70%,回答率大约为70%,要求有95%的把握保证满意率的误差不超过5个百分点,请计算需要抽取的样本量。,课堂讨论1.如果联想电脑公司委托你开展一项笔记本电脑顾客满,36,小结,抽样的基本步骤,总体?抽样框架?抽样方法?样本量?抽样,非概率样本设计,偶遇样本;主观样本;定额样本;滚雪球样本,概率样本设计,简单随机;系统;分层;整群,样本量的的确定,经验法;统计法,回答率问题,趋势分析,小结抽样的基本步骤,37,Sampling(review),Two major concerns,1.Cost,Sample size,Method of data collection(phone,mail,personal,interview),2.Information accuracy,Sample representativeness,Respondent error,Administrative error,Basic questions,What kind of sample?,How large should it be?,Sampling(review)Two major con,38,Sampling Problem,China Light considered offering customer consulting service in which the company would help to make homes more energy efficient.To decide how much customers would like this ser
展开阅读全文