资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第一章 引言,1.1 调查与抽样调查,1.2 根本概念,1.3几种根本的抽样方法,1.4 抽样调查步骤,1,1.2 根本概念,一 目标总体与抽样总体,二,抽样框与抽样单元,三,总体参数与统计量,四 估计量方差、偏倚、均方误差,五 抽样误差与非抽样误差,六 精度与费用,2,1.2根本概念,一、目标总体与抽样总体,目标总体:,简称为总体,是指所要研究对象的全体,它由研究对象中所有性质相同的个体组成,组成总体的各个个体称为总体单元或单位。,抽样总体:,是指从中抽取样本的总体。,思考:,两者是否一致?,3,二、抽样框与抽样单元,抽样框:,是一份包含所有抽样单元的名单,给每一个抽样单元编上一个号码,就可以按照一定的随机化程序进行抽样。抽样总体的具体表现是抽样框。,抽样单元:是构成抽样框的根本要素,抽样单元可以只包含一个个体,也可以包含若干个个体,抽样单元还可以分级。,抽样框的类型:名录框,区域框,自然框,抽样框的要求:,(,1,)抽样框必须是有序的,即抽样单元必须编号。,(,2,)抽样框应与目标总体保持一致。,()尽可能多地提供与研究的目标量有关的辅助信息。,4,三 总体参数和统计量,总体参数:是总体某个特征或属性的数量表现。,常见的总体参数有,4,种:(,1,)总体总值;(,2,)总体均值;(,3,)总体比例;(,4,)总体比率,注:总体总值、总体均值、总体比例三者是统一的,它们都可以用总体均值来表示。,why,5,三、总体参数与样本统计量,1.,总体总量,(population total),:,2.,总体均值,(population mean),:,3.,总体比例,(proportion),:如全部产品中合格品所占比例:,当第,i,单元具有某个特定的特征时,,Y,i,=1,,否则,Y,i,=0,。,4.,总体比率,(population ratio),:式中,Y,、和,X,、为两个总体指标值。,6,统计量,统计量是根据样本的,n,个单元的变量值计算出的一个量,也叫估计量,用于对总体参数进行估计。,注:估计量是随机变量,研究统计量的期望与方差是抽样理论的主要问题。,7,四 估计量方差、偏倚、均方误差,估计量分布的方差称为,估计量方差,,它是从平均的意义上说明估计值与待估参数的差异状况,,也是我们对抽样方案进行评价的标准之一。,估计量方差表达式:,8,偏倚,是指按照某一抽样方案反复进行抽样,估计值的数学期望与待估参数之间的离差。,偏倚的表达式:,对于无偏估计量,偏倚为零。,均方误差,(,Mean Square Error,,,MSE,),指所有可能的,估计值与待估参数之间离差平方的均值,它等于估计量方差加偏倚的平方,即,9,五 抽样误差与非抽样误差,抽样误差:抽样误差是由于抽取样本的随机性造成的样本值与总体值之间的差异。,估计量方差及估计量标准差都为抽样误差的表现形式。,非抽样误差:由于其它多种原因引起的估计值与总体参数之间的差异。,包括:抽样框误差、计量误差、无答复误差等,10,六 精度与费用,样本容量的算术平方根,抽样误差,精度由误差来表现。,抽样误差与样本量有关,样本量越大,在其它条件相同情况下,抽样误差就越小,抽样调查的精度就越高。,调查的费用是一个与样本量有关的函数,最简单的是线性费用函数。,注:另一个影响精度与费用的因素是抽样方法和估计方法,最优抽样设计:指以最小的费用到达要求的精度或者在给定费用的,情况下到达最大的精度。,11,1.3几种根本的抽样方法,概率抽样调查 非概率抽样调查,简单随机抽样,分层抽样,整群抽样,多阶段抽样,系统抽样,等,判断抽样,便利抽样,自愿抽样,配额抽样等,12,例题:,某大学欲了解该校研究生中打算报考托福人数的比例,全校研究生共有,570,人,随机抽取了,100,人,其中有,14,人准备参加托福考试,试以,95%,的把握程度对研究生中欲报考托福人数的比例作出估计。,简单随机抽样:,简单随机抽样也称纯随机抽样,是从抽样框内的,N,个抽样单元中随机地、一个一个地抽取,n,个单元作为样本,在每次抽选中,所有未入样的待选单元入选样本的概率是相等的,这,n,个被抽中的单元就构成了简单随机样本。,13,简单随机抽样,单纯随机抽样:按照等概率原则直接从含有,N,个元素的总体中随机抽取,n,个元素组成样本(,N,n,)。,常用的方法:抽签、随机数字表,优点,:,可能产生代表性样本,缺点,:,1.,抽样框难做,2.,单元较分散,3.,未能充分利用辅助信息,14,分层抽样,分层抽样,(,stratified sampling),又称类别抽样,它是先将总体所有单位按某些重要标志进行分类,(,层,),,然后在各类,(,层,),中独立,,随机地,抽取样本单位的一种抽样方式。,例如,对员工收入状况进行调查,就可将员工按职业不同,分为生产人员、销售人员、管理人员等各层,再从各层中抽取员工。,15,分层抽样,类型抽样,将总体中的所有单位按照某种特征或标志划分为若干类型或层次,在每个类型或层次中采用简单随机抽样或系统抽样的方法抽取一个子样本,共同构成研究的样本.,优点:,1.在不增加样本规模的前提下降低抽样误差,提高抽样精度,增大代表性,2.便于了解总体内不同层次的情况,以及对总体中的不同层次进行单独研究或者进行比较.,注意:,1.分层的标准问题,2.分层的比例问题,16,3.整群抽样:将总体中若干个根本单元合并为组,这样的组称为群。抽样时直接抽取群,然后对中选群中的所有根本单元全部实施调查,这样的抽样方法称为整群抽样。,例如,某,大学,要调查学生的视力,可以将班做为一个群,,随机抽取几个班,对这些班的全部学生进行调查。,17,整群抽样,从总体中随机抽取一些小群体,将小群体的所有元素构成样本,.,优点:,1.,简化抽样过程,2.,降低收集资料的费用,3.,扩大抽样范围,缺点:估计的精度较差,18,4.多阶段抽样:采用类似整群抽样的方法,首先抽取群,但不是调查群内的所有根本单元,而是再进行一步抽样,从选中的群中抽取出若干个根本单元进行调查(二阶段调查)。,如果每个次级单位又可以进一步分为更小的三级单位,那么在每个被抽中的二级单位中再抽取三级单位,这称为三阶段抽样,以此类推,可以定义更多阶段的抽样。,19,多阶段抽样,多级抽样或分段抽样,按照抽样元素的隶属关系或层次关系,把抽样过程分为几个阶段进行。,步骤:,1.以大群为单位编制抽样框,2.抽取若干大群,3.以小群为单位给每个大群编制抽样框,4.分别从每个大群中抽取小群,5.根据需要重复3、4步骤,6.得到根本元素,构成研究样本,优点:方便易行,样本相对集中,节约调查费用,20,系统抽样,系统抽样是将,N,个总体单位按一定顺序排列,先随机抽取一个单位作为样本的第一个单位,然后按某种确定的规则抽取样本的其它单位。,其中最简单也是最常用的规则是等间隔抽取。所以系统抽样又称等距抽样。,21,系统抽样,例如,从600名大学生中抽选50名大学生,利用学校现有名册按顺序编号排序,从第001号编至600号。,抽选距离=,N/n=600/50=12(,人),如从第一个12人中用简单随机抽样方式,抽取第一个样本单位,如抽到的是8号,依次抽出的是20号,32号,44号等。,22,系统抽样,等距抽样或机械抽样,将总体的单位编号排序后,按照固定的间隔抽取个体组成样本的方法,.,优点,:,简便易行,缺点,:,估计量方差较难估计,.,23,第四节 抽样调查步骤,1.,确定调研问题,2.,抽样方案设计,3.,问卷设计,4.,实施调查过程,5.,数据处理分析,6.,撰写调查报告,24,确定调研问题,整个调查的第一步,也是至关重要的一步。在这个过程中首先需要明确的定义问题,包括对整个问题的的叙述以及确定研究问题的具体组成局部。只有问题定义清楚了,才有可能进一步设计和执行。,确定调研问题所要答复的是“要做什么样的调查研究和“为什么要做这项研究。调研人员需要考虑研究的目的、相关的背景材料、所需要的信息以及这些信息在分析时如何使用。,25,抽样方案设计,抽样方案要描述样本是如何抽取的。调查中有不同的数据收集方法,如面访调查、电话调查、邮寄调查等。不同的收集方法需要不同的抽样框,抽样方案设计也包括抽样框的设计。,此外对样本又有不同的抽取方法,在制定抽样方案时既要考虑方法的科学性,又要照顾实际的可行性。,26,2,抽样方案设计,1.,界定总体及目标量:范围与界限,2.,制定抽样框:收集总体中全部抽样单位的名单,并对名单统一编号。,分段、分层抽样时则要分别建立起几个不同的抽样框,3,确定收集数据的方法,4.,决定抽样方案:确定抽样方法、样本规模、主要目标量的精确程度,,确定总体目标量的估算方法。,27,问卷设计,问卷设计的根本问题,1.设置的问题应当围绕调查的目的展开。,2.访问时间的长短要适当控制。,3.在问卷的开头往往设置问题以区别被访问者的类型。,4.所提问题要清晰,用词要妥帖,并注意礼貌。,5.问题要有层次地展开,市场调查等问卷中要注意有比较。,6.注意问卷的格式。,7.一般问卷中应设有编码栏。,28,实施调查过程,在这个过程中要获得样本单元的调查数据,关键的问题是要保证原始数据的质量,这就需要对调查过程进行有效的管理和监控。,调查实施前需要对调查员进行技术培训,使调查员熟悉调查问卷,掌握访谈技巧,并增强责任心。,在调查过程中加强质量检验,出现问题及时总结,及时补救。,调查人员要有操作手册,调查过程中也要有管理制度和措施,使得从事具体调查的人员有章可循。,29,数据处理分析,调查的收获阶段,它为撰写调查报告提供根本的素材。在这个阶段,首先要对经过调查获得的原始数据进行检查、核对,对验收合格的调查问卷进行编码和录入。数据录入后,多数情况下需要进行数据的预处理,为统计分析做好准备。,数据的预处理包括:录入数据的再编码,它是对原编码的补充和调整,满足某些统计分析软件对编码的特殊要求,也是根据研究要求对数据的重新归类分组;对缺失值进行插补,以构造出完整的数据集;进行变量的转换,进而进行常规的统计分析;计算目标量的估计值、方差及变异系数的估计值等。,30,撰写调查报告,(1)主题:清楚地指出此调查的目的,并提出对调查结果的使用方式。,(2)范围:正确地描述调查范围,包括指定的研究定义及调查的地理区域。,(3)调查对象:详细叙述此调查所收集的资料工程及为列表工程的原因。,(4)资料收集方法:清楚地叙述所采用的收集资料的方法。此外,收集资料过程中遇到的困难及解决的方法,均应详细说明。,(5)调查期、参考期和报告期。,31,(6)抽样设计和估计程序:清楚说明调查中所使用的抽样单元、抽样框、样本大小和抽样方法,指出估计时所用的公式。,(7)结论的描述:列表资料应该以清楚且易于理解的方式列出。,(8)精确度:调查结果中应该列出估计所到达的精确程度、检验及比较的结果、对调查质量的评估。还必须指出无答复者的种类、比例以及对最后结果的影响程度。,(9)责任:主办机构及指挥此调查的机构须在报告中提出。,(10)参考文献。,32,(,5,)撰写调查报告,(1)主题:清楚地指出此调查的目的,并提出对调查结果的使用方式。,(2)范围:正确地描述调查范围,包括指定的研究定义及调查的地理区域。,(3)调查对象:详细叙述此调查所收集的资料工程及为列表工程的原因。,(4)资料收集方法:清楚地叙述所采用的收集资料的方法。此外,收集资料过程中遇到的困难及解决的方法,均应详细说明。,(5)调查期、参考期和报告期。,33,(6)抽样设计和估计程序:清楚说明调查中所使用的抽样单元、抽样框、样本大小和抽样方法,指出估计时所用的公式。,(7)结论的描述:列表资料应该以清楚且易于理解的
展开阅读全文