《数据的搜集》PPT课件.ppt

上传人:za****8 文档编号:3173304 上传时间:2019-12-06 格式:PPT 页数:61 大小:1.29MB
返回 下载 相关 举报
《数据的搜集》PPT课件.ppt_第1页
第1页 / 共61页
《数据的搜集》PPT课件.ppt_第2页
第2页 / 共61页
《数据的搜集》PPT课件.ppt_第3页
第3页 / 共61页
点击查看更多>>
资源描述
第2章数据的收集,学习目标,1.了解数据的来源2.掌握抽样的方式和收集数据的方法3.学会统计调查方案的设计、调查问卷的设计4.了解统计数据的误差5.了解数据文件的格式,第一节数据的来源,一、数据的来源,国家统计资料,行业协会信息资料,图书资料,计算机信息网络,国际组织,调查或观察,实验,使用二手数据需要注意的问题,应注意数据的含义、计算口径和计算方法,避免误用或滥用;注意二手数据的时间性,不能用过时的数据;应充分搞清这些数据的来源和可靠程度;应注明数据的出处,以尊重他人的劳动成果。,(一)普查(Census),特点:普查通常是一次性的或周期性的普查一般需要规定统一的标准时点普查数据的准确性、标准化程度均较高普查的调查项目较少,适用范围较狭窄,调查资料缺乏深度。,二、常用的统计调查方式,(二)抽样调查(SamplingSurvey),抽样调查:是一种非全面调查,它是按照一定程序从总体中抽选一部分单位(样本)进行调查或观察,并以此对总体参数做出推断的调查方法。,特点:经济性时效性强适应面广有可能获得比普查更高的数据质量,(三)统计报表,统计报表是按照国家有关法规规定,自上而下地统一布置、自下而上地逐级提供基本统计报表的统计报告制度。,第二节抽样调查,概率抽样方法非概率抽样方法收集数据的基本方法调查方案设计调查问卷设计,一、抽样调查方法的分类,(一)概率抽样(probabilitysampling)也称随机抽样,在调查总体样本中的每个单位都具有同等可能性被抽中的机会。特点:按一定的概率抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的(或是可以计算出来的)按样本对总体目标量的估计,与每个样本单位被抽中的概率有关,1、简单随机抽样(SimpleRandomSampling),从总体N个单位中随机地抽取n个单位作为样本,每个单位有相同的概率被抽取。方法:抽签法和随机数法适用场合当总体内样本单位不多,且有完备名册总内样本单位间的差异不大时无法充分获得总体信息时,2、系统抽样(SystematicSampling),也称等距抽样:将总体N个单位按某种顺序排列,按规则确定一个随机起点,再每隔一定间隔逐个抽取样本单位的抽样方法特点:不放回抽样对估计量方差的估计缺少一般的方法适用于总体中个体数较多,抽取样本容量也较大时;,3、分层抽样StratifiedSampling,把抽样单位按某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。问题:如何分层原则:层内样本的差异要小,而层与层之间的差异尽可能地大特点可以提高估计的精度不仅可以对总体参数进行估计,也可以对各层的目标量进行估计可以方便组织实施调查,4、整群抽样ClusterSampling,把总体按某种规则划分为若干个组,每个组称为群。抽样时只抽取群,并对抽取的群进行普查。原则:群内差异大,而群间的变异小时特点抽样时只需群的抽样框可以节省调查费用,方便调查的实施估计精度通常低于简单随机抽样,5、多阶段抽样,先从总体中随机地抽取若干初级单位,再从初级单位中抽取若干二级单位,如此下去直至抽取所要调查的基本单位的抽样方法。例如:统计年鉴2004指出2003年人口变动情况抽样调查是以全国为总体,各省、自治区、直辖市为次总体,采用分层、等距、整群概率比例抽样方法,在全国31个省、自治区、直辖市抽取了990个县(市、区)、3734个乡(镇、街道)、6544个调查小区的126万人。,特点:适用于总体分布很广,不可能从总体中直接抽取样本单位的情况不需要全部低级单位的抽样框,节省了调查费用方法灵活多样,(二)非概率抽样,非概率抽样中单个单位被选中的概率是不可知的,无法根据样本计算抽样误差。,1、方便抽样Conveniencesampling,事先不预定样本,碰到即问或被调查者主动回答问题。便利抽样、偶遇抽样。例如:在街头的拦截式访问。登在报刊、网上的问卷。,2、判断抽样JudgmentSampling,调查者根据主观经验和判断从总体中选取有代表性的单位构成样本特点抽样成本比较低,容易操作适用于总体单位极不相同而样本容量又很小的情况调查结果不能用于对推断总体,3、配额抽样Quotasampling,是非随机抽样方法中最常用的一种抽样方法。分为两个步骤:根据研究人员认为较重要的一些变量把总体单位分类,指定每一类中的定额;然后在每一类中使用方便抽样或判断抽样的方法抽选指定数量的样本单位。问题:与分层抽样的区别?,4、雪球抽样SnowballSampling,其原理是先找到最初的样本单位,然后根据他们提供的信息去获得新的样本单位;这种过程不断继续,直到完成规定的样本容量为止特点:主要用于对稀少群体的调查。调查结果不能推断总体,概率抽样:可以根据调查的结果推断总体非概率抽样:不能根据调查的结果推断总体,概率抽样与非概率抽样的比较,实际上每个抽样通常都可能是各种抽样方法的组合。既要考虑精确度,还要根据客观情况考虑方便性、可行性和经济性。不能一概而论。这些抽样方法的选择多半是种艺术,而不是科学。,二、搜集数据的基本方法,数据搜集不同方法的特点归纳,表2-3,三、调查方案设计,(一)确定调查目的(二)确定调查对象和调查单位(三)设计调查项目和调查表(四)明确调查时间与期限方案(五)选择调查方法与资料搜集方式(六)调查组织实施工作,(一)调查目的(objectiveofsurvey),1.调查要达到的具体目标2回答“为什么调查?”3调查之前必须明确,(二)调查对象和调查单位(RespondentandSurveyunit),调查对象:调查研究的总体或调查范围调查单位:需要对之进行调查的单位。可以是调查对象的全部单位(全面调查),也可以是调查对象中的一部分单位(非全面调查)回答“向谁调查?”,(三)确定调查项目,拟定调查表调查什么(What),单一表:“一户一表”。一张表格只列一个调查单位。问卷是其特例。一览表:“多户一表”。一张表格列多个调查单位。,(四)明确调查时间与期限何时调查何时数据(When),调查时间,等于,调查项目所属时间,起讫时间,如:是年度数据还是月份数据?,标准时间,90年7月1日零点00年11月1日零点,调查期限,等于,调查工作时间,狭义:资料搜集的最后期限广义:资料搜集/数据处理/分析写作等全程的研究期限,(五)选择调查方法与资料搜集方式什么方法(Which),选择调查方法,全面性?,全面调查,非全面调查,随机性?,非概率抽样,概率抽样,纯随机抽样分层抽样整群抽样系统抽样多阶段抽样,方便抽样判断抽样自愿样本滚雪球抽样配额抽样,(六)调查组织实施工作如何开展(How),1、调查组织分工2、调查员选择(性别/年龄/经验)与培训(工作培训与专业培训)3、费用预算与宣传4、调查研究进度,三、问卷设计,问卷的基本结构问卷中问题的设计问卷中答案的设计问题顺序的设计,问卷设计的步骤,1.根据研究目的建立分析架构,2.决定问卷之形式,3.编拟问卷初稿,4.邀请专家学者检查、修订问卷,5.预试问卷,6.问卷定稿并订定使用说明,(一)问卷的基本结构,问卷的基本结构,开头部分,甄别部分,主体部分,背景部分,问候语,填写说明,问卷编号,也称过滤,通过一些问题筛掉不符合条件的被调查者。,要调查的全部问题,以及这些问题可供选择的答案。,被调查者的性别,职业,收入,文化程度,婚姻状况等,(二)问卷中问题的设计,1、提问的内容尽可能短。“我国越来越多的人去国外旅游。您曾经去别的国家旅游过吗?如果去过,您也许是为了欣赏风光才去的。那么,别国的风光对您决定出国旅游有多重要?”Q1:您出国旅游过吗?1、是2、否(终止访问)Q2:那里的风光对您决定去旅游有多重要?,2、用词要确切通俗,避免不具体的问题,Q:您对本餐厅是否满意?1.满意2.一般3.不满意满意一般不满意Q1:您对本餐厅饭菜质量是否满意?Q2:您对本餐厅环境设施是否满意?Q3:您对本餐厅服务态度是否满意?,3、一项提问只包含一项内容,一个问句最好只问一个要点。一个问句中如果包含过多询问内容,会使被调查者无从答起,给统计处理也带来困难。你经常看电影和电视吗?,4、避免诱导性提问,应避免诱导性、暗示性的提问。诱导性提问会导致两个不良后果:“绝大多数饮用过光明奶的人都认为它口味纯正,您认为是这样吗?”,5、避免否定形式的提问,否定式的提问会影响到被调查者的思维,或容易造成相反意愿的回答。Q:您不认为听到国歌不立正不是不对的吗?1.是2.不是,6、避免敏感性问题,敏感性问题是指与个人或单位的隐私或私人利益有关而不便向外界透露的问题。你是否在考试中作过弊?您是否有酒后驾车行为?,(三)问卷中答案的设计,开放性问题是指对问题的回答未提供任何具体的答案,由被调查者根据自己的想法自由做出回答,属于自由回答型。封闭型问题是指对问题事先设计出了各种可能的答案,由被调查者从中选择。封闭型问题答案的设计方法主要有:两项选择法、多项选择法、顺序选择法、评定尺度法、双向列联法等。,1、二项选择法,二项选择法也称二分法,即提出的问题只有两种答案:“是”或“否”,“有”或“无”等。这两种答案是对立的、排斥的,被调查者的回答非此即彼,不能有更多的选择。如:您是否购买了笔记本电脑?A、是B、否,2、多项选择法,有些问题还需要采用选择多个答案,以统计出多个答案的重要性及差别。Q1您购买山地自行车的原因是()(可多选)A、经济条件许可B、用于代步工具C、便于郊外旅游,锻炼身体D、别人有你也想有,赶时髦E、作为礼物送给亲人朋友F、其它,3、顺序选择法,顺序选择法的问题是列出若干个答案,要求被调查者按其重要性或记忆的先后顺序将它们一一排列。Q:您在找工作的过程中遇到的主要问题是(请您依次排序)()A专业不对口B没有本地户口C缺乏社会关系D招聘信息不足E性别歧视F其他,4、评定尺度法,评定尺度法也称量表法,量表是一种工具,是将一些主观的、抽象的概念定量化。Q:您对我校教学评估体系总体感觉如何?A、非常满意B、比较满意C、一般D、不太满意E、非常不满意,5、双项列联法,将两种不同的问题综合一起,通常用表格的形式来表现,可以节省问卷的篇幅。,Q:请在您赞同项目的空格内划“”,设计问题答案时的注意事项,答案要穷尽。答案要互斥。您上月的支出中花费最多的是:A食品B服装C书籍D饮料E其它,(四)设计问题顺序应注意的问题,1、问题的安排应具有逻辑性;2、问题的安排应先易后难、由浅入深;3、问卷主体部分的问题通常按过滤性、热身性、容易性、困难性的顺序进行排列。,第三节实验数据,(一)将研究对象分为两组:实验组和对照组(二)实验组和随机组的产生应遵循随机原则,一、实验组和对照组,二、实验中的若干问题,当研究的对象是人的时候,会产生如下一些问题(一)人的意愿(二)心理问题(三)道德问题从而在划分实验组和对照组时,应采取相应的措施.,第四节数据的误差,一、抽样误差(samplingerror),假定在某一职业人群中女性占的比例为60%。如果在这个人群中抽取一些随机样本,这些随机样本中女性的比例并不一定是刚好60,可能稍微多些或稍微少些。这是很正常的,因为样本的特征不一定和总体完全一样。这种差异不是错误,而是必然会出现的抽样误差所有样本可能的结果与总体真值之间的平均差异影响抽样误差的大小的因素样本量总体的变异性抽样的方式方法,二、非抽样误差(non-samplingerror),由其他原因造成的样本观察结果与总体真值之间的差异存在于所有的调查之中类型抽样框误差回答误差(理解误差、记忆误差、意识误差)无回答误差调查员误差测量误差,三、误差的控制,抽样误差可计算和控制非抽样误差的控制调查员的培训调查结果进行检验督导员的调查专业水平调查过程控制现场调查人员进行奖惩的制度,第五节数据文件,在利用计算机进行统计分析时,首先应把统计数据录入计算机,形成数据文件。数据文件的一般格式(文字),表2-5,数据文件的一般格式(代码),代码:男1,女0;可乐1,雪碧0;知道0,不知道0。,小结,数据资料搜集的突出特点:“难”为什么难呢?两条:利益主体多元化,商业机密的保护,学会统计调查方案的设计、调查问卷的设计掌握统计调查的方法,
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!