资源描述
,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,调查技能教程电子讲义2003年4月,调查技能教程电子讲义2003年4月,1,我国的统计调查体系,以抽样调查为主体,以全面报表和周期性普查为基础,,第一章 调查导论,我国的统计调查体系第一章 调查导论,2,第一章 调查导论,调查的概念,调查就是使用明确的概念、方法和程序,以有组织、有条理的方式,从一个总体的部分或所有单元中搜集感兴趣的指标信息,并将这些信息综合编辑成有用的简要形式的所有活动。,注,:“部分单元”一般指抽样调查;“所有单元”即普查。,第一章 调查导论调查的概念,3,第一章,调查导论,调查步骤,调查目标的系统陈述;,抽样框的选择;,抽样方法的确定;,问卷设计,数据收集;,数据编码和录入;,第一章 调查导论调查步骤,4,第一章,调查导论,调查步骤,审核与插补;,估计;,数据分析和调查结果的表述;,数据发布;,文档。,第一章 调查导论调查步骤,5,第一章,调查导论,调查的生命周期,调查计划,设计和开发,操作与实施,调查评估,第一章 调查导论调查的生命周期,6,第二章,调查目标的系统陈述,目标陈述的步骤和过程,确定信息需求(陈述问题),使用一般的术语来描述客户对调查的信息需求。,第二章 调查目标的系统陈述目标陈述的步骤和过程,7,第二章,调查目标的系统陈述,目标陈述的步骤和过程,确定数据的使用者(用户)和数据的用途,数据用户的意见在调查计划阶段中十分重要;,确定数据应用的范围应适当控制,不宜过大;,应使信息需求得到具体且精确的表述。,第二章 调查目标的系统陈述目标陈述的步骤和过程,8,第二章,调查目标的系统陈述,目标陈述的步骤和过程,尽可能地使用清楚、精确,已形成共识的标准定义,从而方便数据使用者和被调查者的交流,确保调查的一致性。,第二章 调查目标的系统陈述目标陈述的步骤和过程,9,第二章,调查目标的系统陈述,目标陈述的步骤和过程,调查内容,必须确认调查内容包括信息需求的所有方面,但不包括任何无关项目,这是为了避免不必要的调查费用或者给被调查者带来过重的回答负担。,第二章 调查目标的系统陈述目标陈述的步骤和过程,10,第二章,调查目标的系统陈述,目标陈述的步骤和过程,分析方案(生成表),确定每个项目的调查结果所需的详细程度及形式。,对数据分析和表示方式的详细计划称为分析方案,并需要制作生成表(数据汇总表的格式)。,生成表是将每个调查项目的调查结果按被调查者的类别分类列出而生成的数值表或频数表。,生成表为以后的分析,也为问卷设计中确定相应调查项目的详细程度及整个问卷的框架提供了依据。,第二章 调查目标的系统陈述目标陈述的步骤和过程,11,第二章,调查目标的系统陈述,地域,劳动力情况,就业,待业,下岗,非劳动力,合计,城市,A,城市,B,城市,C,地区,D,地区,E,总 计,表,2.3,2001年按,P,省地域划分,的,成年人口的劳动力情况,生成表例:,第二章 调查目标的系统陈述地域劳动力情况 就业待业下岗非,12,第二章,调查目标的系统陈述,影响目标陈述的限制性因素,要求的精度;,可以利用的资源(预算、人力和设备);,对调查进度的要求;,用现有的技术能否对调查变量进行测量;,被调查者回答问题负担是否过大;,被调查单位或个人的隐私或机密是否会被泄露;,对被调查者的名誉是否有负面影响。,第二章 调查目标的系统陈述影响目标陈述的限制性因素,13,第三章,调查设计导论,两种不同的调查:,普查与抽样调查,二者差别:,在普查中,我们从总体的所有单元中收集信息;而在抽样调查中我们仅仅从总体中的一部分(通常是很小的一部分)单元中收集信息。,抽样调查的优点:能在充分满足客户所需信息质量的前提下,提供一种更快、更节省的方法。,相对于普查来说,抽样调查规模小,因而更容易进行监控,对被调查者的心理压力也,小。,第三章 调查设计导论两种不同的调查:普查与抽样调查,14,第三章,调查设计导论,两种不同的调查:,普查与抽样调查,一项经科学设计并严格实施的抽样调查完全有可能获得比全面调查(普查)更为准确、更为可靠的结果。,第三章 调查设计导论两种不同的调查:普查与抽样调查,15,第三章,调查设计导论,两种不同的调查:,普查与抽样调查,在抽样调查和普查之间作抉择时,最需要考虑的因素:,费用;时效;,总体大小;小区域估计;,属性的多寡;调查误差;,特殊要求;其它因素。,进行普查的一个原因是为了获得一些标准信息(或辅助信息)。这些信息可以用于改进抽样设计或抽样调查的估计量。,第三章 调查设计导论两种不同的调查:普查与抽样调查,16,第三章,调查设计导论,目标总体和调查总体,目标总体就是希望从中获取信息的总体。它是所感兴趣的所有单元的集合。在陈述调查目标时就应定义目标总体。,定义目标总体所必不可少的四个因素是:,总体中单元的类型;,单元的特征(指标);,单元的地理位置;,调查的标准时点(或时期)。,目标总体只是概念性的,并不一定需要一个实际存在的名录。,第三章 调查设计导论目标总体和调查总体,17,第三章,调查设计导论,目标总体和调查总体,调查总体(抽样总体)即实际调查所覆盖的总体。它可以与目标总体不完全一致,理想状态下,这两个总体应该很相似。,依据调查的结果所得出的结论仅适用于调查总体。,第三章 调查设计导论目标总体和调查总体,18,第三章,调查设计导论,抽样框(调查框),抽样框(调查框)提供了一条辨别和联系调查总体单元的有效途径。对于抽样调查,可根据抽样框计算总体中每个单元的入样概率。,抽样框应该包括下述部分或全部内容:,识别资料;联系资料;分类资料;,维护与连接资料(为更新抽样框);,辅助资料。,第三章 调查设计导论抽样框(调查框),19,第三章,调查设计导论,抽样框(调查框),抽样框的类型,名录框(目录框)是有关所有总体单元的一份实际的或者概念的名录清单。,概念名录框常是基于一个调查正在进行中才存在的总体。,实际名录框可取自各种不同的来源。各级政府机构因各自的管理目的都保存一些名录,他们也是对抽样框进行维护的最有效的资料来源。,第三章 调查设计导论抽样框(调查框),20,第三章,调查设计导论,抽样框(调查框),区域框是其单元由地理区域构成的一种特殊的名录框,也称地域框。,区域框适用于以下所述的两种情况:当调查本质就是地理性质的(如通过每平方公里的野生动物数来估计野生动物的总数);或者不能获得一个适当的名录框。,第三章 调查设计导论抽样框(调查框),21,第三章,调查设计导论,抽样框(调查框),当没有合适的名录框时,可以考虑借助区域框来构造名录框。通过一个区域框抽取地理区域,并列出被抽中区域内的单元清单。,对不断变化的总体,任何名录框都会很快过时。比较而言,由于地理边界相对稳定,维护一个区域框也就更为容易。,区域框中的单元可以分不同的层次,上一级单元可以细分成许多下一级单元。,第三章 调查设计导论抽样框(调查框),22,第三章,调查设计导论,抽样框(调查框),多重抽样框:是两个或两个以上的抽样框的组合(如名录框和区域框的组合或者两个或两个以上名录框的组合)。,第三章 调查设计导论抽样框(调查框),23,第三章,调查设计导论,抽样框(调查框),抽样框的优良性准则:,实用;,精确;,时效;,费用。,第三章 调查设计导论抽样框(调查框),24,第三章,调查设计导论,抽样框(调查框),抽样框可能的缺陷,:,不完全涵盖(或不完全覆盖);,过涵盖(过覆盖);,重复;,分类误差。,第三章 调查设计导论抽样框(调查框),25,第三章,调查设计导论,调查误差,抽样误差,抽样误差是指仅根据对总体的一部分而不是全部的调查来估计总体特征所引起的误差。,对于概率抽样调查,可以计算抽样误差。计算方法取决所用的抽样方法与估计方法(抽样策略)。,第三章 调查设计导论调查误差,26,第三章,调查设计导论,调查误差,抽样误差的大小取决于下列因素:,样本量,;,总体指标的变异程度;,抽样设计;,估计方法;,总体大小。,第三章 调查设计导论调查误差,27,第三章,调查设计导论,调查误差,非抽样误差,:,非抽样误差为除抽样之外的几乎所有调查活动过程中所产生的误差。非抽样误差不仅出现在抽样调查中,也出现在普查中。非抽样误差可以划分为两类:,随机误差:如果样本足够大,这类误差可以忽略。随机误差只增加估计值的变异性。,系统误差:误差倾向于同一个方向,会导致最终结果的偏倚。,非抽样误差的计量,极为困难。与抽样方差不同的是,系统误差导致的偏倚不能随样本量的增大而减少。,第三章 调查设计导论调查误差,28,第三章,调查设计导论,调查误差,非抽样误差的来源,:,涵盖误差,涵盖误差表示在抽样框或者样本中出现了单元的遗漏、错误的包含、重复以及错误的分类。涵盖误差可以导致估计的偏倚,且偏倚的大小随总体的不同而不同。,第三章 调查设计导论调查误差,29,第三章,调查设计导论,调查误差,非抽样误差的来源,:,计量误差,计量误差是指对一个问题所做的回答记录与它的真值之间的差异。,计量误差能影响非抽样误差的大小并造成估计的偏倚。如果计量误差是随机的(实际获得的观测值随机地散布在真值周围),则会增大估计值的方差,从而降低调查的精度。如果计量误差系统地偏向某个方向或某个类别,就会产生估计的偏倚。,第三章 调查设计导论调查误差,30,第三章,调查设计导论,调查误差,非抽样误差的来源,:,无回答误差,无回答有两种类型:全部无回答(单元无回答)和部分无回答(项目无回答)。,单元无回答是指被调查单元没有提供任何信息,,而,项目无回答是指问卷中某些问题的回答空缺。,第三章 调查设计导论调查误差,31,第三章,调查设计导论,调查误差,非抽样误差的来源,:,无回答误差,无回答的影响:,无回答的被调查者与回答的被调查者具有不同的特征,因此如果对无回答不予纠正,将会引起调查估计的偏倚。,由于进行回答的单元比预期的要少,有效样本的数量减少,从而使抽样误差增大。,单元无回答的产生的原因:,无人在家、拒绝访问或者由于某些原因所抽中的人无法参加调查;不完整的抽样框资料是无回答产生的另一个,原因。,第三章 调查设计导论调查误差,32,第三章,调查设计导论,调查误差,非抽样误差的来源,:,无回答误差,项目无回答发生在以下场合:,被调查者不知道答案;拒绝回答某个问题;忘了回答;或者错误地跟随问卷的进程漏了回答;或由于有病或语言障碍而不能回答。,设计低劣的问卷或者访问本身也会引起项目无回答。,无回答的产生也有访员的原因。,数据收集方法也会造成无回答误差。,第三章 调查设计导论调查误差,33,第三章,调查设计导论,调查误差,非抽样误差的来源,:,处理误差,处理是指将收集的调查结果转化为适合于列表及进行进一步数据分析所需要的形式。,处理包含数据收集以后,作估计以前,对数据的编码、录入、审核及插补等的一切活动。,处理误差通常可通过质量保证和控制方法来监控。,第三章 调查设计导论调查误差,34,第四章,数据收集方法,数据收集的概念,数据收集是在调查中对每一个被抽中的单元收集信息的过程。这个过程包括:,找到被抽中单元并与之相接触或建立联系;,取得他们的配合;,提问(或直接测量);,记录回答(结果)。,数据收集的目标是获得尽可能完整且精确的数据。,第四章 数据收集方法数据收集的概念,35,第四章,数据收集方法,数据收集的模式,两种主要数据收集模式,纸张式 回答记录在用纸印刷的问卷上,数据录入是数据收集后的一个单独的过程。对于一次性调查来说,纸张式方法通常比计算机辅助式方法更便宜,且开发所需时间也少。,计算机辅助式 问卷出现在计算机屏幕上,调查时将答案直接输入到计算机中。数据收集成为一个完整、快速的,比纸张式方法更有效的过程。,第四章 数据收集方法数据收集的模式,36,第四章,数据收集方法,数据收集的模式,计算机辅助数据收集方法的其他优点:,问卷在问题的设置流程和审核方面可以更复杂;,对数据质量更容易进行监督和控制;,更容易产生关于访问情况的管理报告;,能够导致较少的回
展开阅读全文