统计学(第三版)课件第2章统计数据的搜集.ppt

上传人:za****8 文档编号:15492520 上传时间:2020-08-12 格式:PPT 页数:82 大小:2.03MB
返回 下载 相关 举报
统计学(第三版)课件第2章统计数据的搜集.ppt_第1页
第1页 / 共82页
统计学(第三版)课件第2章统计数据的搜集.ppt_第2页
第2页 / 共82页
统计学(第三版)课件第2章统计数据的搜集.ppt_第3页
第3页 / 共82页
点击查看更多>>
资源描述
学习目标,了解数据的来源 了解统计调查方式 了解数据的搜集方法 掌握调查方案的设计 了解数据误差及对数据的质量要求,Data Sources,数据来源,直接来源,间接来源,试验,出版物,(或者网上),问卷调查,观察,第一节 统计数据的来源,常用的统计数据来源,中国统计年鉴 中国统计摘要 中国统计信息网(国家统计局网站) ,常用的统计数据来源,美国经济分析局http:/www.bea.doc.gov 美国人口普查局http:/www.census.gov 美国劳工统计局http:/stats.bls.gov 美联储经济数据库http:/www.stls.frb.org/fred 美国联邦统计http:/www.fedstats.gov 世界银行http:/www.worldbank.org 国际货币基金组织http:/www.imf.org OECD http:/www.oecd.org,指直接从各调查单位收集的用来反映个体特征的数据资料,统计调查是整个统计认识活动的基础, 决定着统计认识过程及其结果的成败,第二节 统计调查,一、统计调查,收集原始数据资料的统计活动过程,按调查单位的范围大小分为,统计调查的种类,按调查时间是否连续分为,按调查的组织方式不同分为,指按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度,统计报表 制度,优点,局限,指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查,作用,局限,由于需要大量的人力、物力和财力,不宜经常进行,普查,为了解总体基本情况,在调查对象中只选择一部分重点单位 进行调查的一种非全面调查组织方式,作用,局限,能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料,只适用于客观存在着重点单位的情况,重点调查,这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况,1重点调查中的重点单位,是指( ) A处于较好状态的单位 B规模较大的单位 C体现当前工作重点的单位 D就调查标志而言在总体中占有很大比重的单位,典型调查,在对调查对象有一定了解的基础上,有意识地选择少数典型单位 进行调查的一种非全面调查组织方式,不能确定推断的把握程度,无法计算和控制推断误差,作 用,指在数量表现上具有普遍意义和代表性的总体单位,可以用来推断总体的数量,局 限,按照 随机原则 从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式,抽样调查,指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会,特 点,优 点,总体单位,调查单位,总体单位,调查单位,报表制度,可以全面调查,但通常是调查限定规模以上的总体单位,总体单位,调查单位,普 查,对全部单位进行调查,总体单位,调查单位,重点调查,只调查重点单位(单位数不多但其标志量占标志总量比重较大的单位),总体单位,调查单位,典型调查,对典型单位进行调查,典型单位的选择并不一定按规模,总体单位,调查单位,抽样调查,按随机原则选择调查单位,各单位被选中的机会相同。,抽样调查的含义,抽样调查是按照一定的程序,从所研究对象的全体中抽取一部分单位进行调查,并在一定条件下对研究对象的数量特征进行估计和推断。 抽样调查包括概率抽样调查和非概率抽样调查两种。,一、概率抽样和非概率抽样,(一)概率抽样 概率抽样也称随机抽样,它有以下几个特点: 首先,抽样时是按一定的概率以随机原则抽取样本。所谓随机原则就是在抽取样本时排除主观上有意识地抽取调查单位,使每个单位都有一定的机会被抽中。,其次,每个单位被抽中的概率是已知的,或者是可以计算出来的。 最后,当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。,(1)简单随机抽样,抽样框。进行概率抽样需要抽样框,抽样框通常是包括所有总体单位名单。如企业名录,学生名册,住户门牌号码等。 简单随机抽样就是从包括总体N个单位的抽样框中随机地、一个一个地抽取n个单位作为样本,每个单位入样的概率是相等的。,简单随机抽样是一种最基本的的抽样方法,是其他抽样方法的基础。 特点:简单、直观; 在抽样框完整时可直接从中抽取样本; 抽选概率相同;,(2)分层抽样 分层抽样是将抽样单位按某种特征或某种规则分为不同的层,然后从不同的层中独立、随机地抽取样本。将各层的样本结合起来对总体的目标量进行估计。,(3)整群抽样 整群抽样是指将总体各单位划分成许多群,然后从中抽取部分,对中选群的所有单位逐个进行调查的一种抽样调查技术形式。整群抽样因为是对中选群的全面调查,所以调查单位很集中大大简便抽样工作,节省经费开支。,(4)系统抽样 将总体中的所有单位按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。,非概率抽样技术,非随机抽样是指在抽样时不按照随机原则,而是由调查者根据调查目的和要求,主观设立某个标准从总体中抽选样本的抽样方式。非随机抽样主要有五种具体方式:,方便抽样:是根据调查者的方便与否,以尽可能使调查对象对总体具有代表性为原则的一种调查方法。 判断抽样:是指市场调查者根据自己的主观判断经验和知识,从总体中选择具有典型代表性的单位作为样本的一种抽样方法。,配额抽样:它是先按照市场调查对象的某种特征,将总体分为若干类,然后按一定的比例在各类中分配样本单位数额,并按各类数额在每类中任意或主观抽样。,滚雪球抽样:是通过以一触十、 以十触百,类似“滚雪球”的方式抽取样本。运用这种方法的前提是样本单位之间具有一定的联系,是在不了解总体的情况下去了解总体的一种方式。,(三)抽样的类型,非随机抽样,随机抽样,判断抽样,定额抽样,方便抽样,简单随机抽样,抽样类型,系统抽样,分层抽样,整群抽样,下列哪种调查方式样本不是随机选取() A分层抽样 B系统抽样 C整群抽样 D判断抽样 如果要搜集某一特定群体的有关资料,适宜采用的调查方式是() A系统抽样 B整群抽样 C滚雪球抽样 D判断抽样,(三)概率抽样与非概率抽样的比较,概率抽样是依据随机原则抽选样本,这时样本统计量的理论分布是存在的,因此可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,并且在进行抽样设计时,对估计的精度提出要求,计算为满足特定精度要求所需要的样本量。 而非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。但操作简便、时效快、成本低,适合于探索性的研究,可从调查中发现问题。 有时在一项研究项目中,也可以把概率抽样和非概率抽样相结合,发挥各自的特点,满足研究中的不同需求。,鉴于对统计学专业知识的需求,在以后讨论中,如无特殊说明,均假定数据取自于概率样本,同时也假定样本是采用简单随机抽样的方式抽取。,二、搜集数据的基本方法,(一)自填式 自填式指在没有调查员协助的情况下,由被调查者自己填写,完成调查问卷。 方式:邮寄、网络、媒体。 要求:调查问卷结构严谨,有清楚的说明,应有制作详细、形象友好的说明。 特点:成本低,适用大范围调查,减少被调查者压力。 返回率低,周期长,出错率高。,(二)面访式 调查员与被调查者面对面,提问回答。 特点:数据质量高,可调节调查时间 成本高,存在调查员主观因素影响,(三)电话式 电话式是指调查人员通过打电话的方式向被调查者实施调查。 速度快、成本低、容易控制。,(四)数据搜集方法的选择 1、抽样框中的有关信息 抽样框中有关信息是影响方法选择的一相因素。 如:抽样框中没有通讯地址,就不能将自填式问卷寄给被调查者; 没有计算机随机数字拨号系统,又没有电话号码的抽样框,电话调查的概率样本就难以产生。,2、目标总体特征 目标总体的特征也影响数据搜集的方法。 如:总体的识字率很低,就不宜使用自填式方法 样本单位分布很广,地域跨度太大,进行面访式的调查,交通费用就会很高,且过程管理也难以控制。,3、调查问题的内容 对于比较复杂的问题,面访调查比较适合。 如果调查问题涉及一些敏感性问题,也可以设置匿名的数据搜集方法,如自填式可能比较适合。,4、有形辅助物的使用 如在调查期间显示产品、产品样本、广告、或促销演示等,有时还需要让被调查者试用产品,然后再接受调查。这对于面访问式比较适合。,5、实施调查的资源 实施调查的资源会对搜集数据方法产生重大影响。 如经费预算、人员配备、调查设备和调查所需要的时间。 如劳务费、交通费、礼品费是面访所必须的。,6、管理与控制 对调查员的控制,电话调查就比面访调查容易控制。,7、质量要求 在面访和电话调查中,调查员的水平和素质对调查质量的影响是显而易见的;有经验的调查员还可以对被访者回答的真实性做出判断,并采用适当的方法予以澄清。 回答率也是影响质量的一个重要因素。,在数据搜集使用方法的选择中要根据调查所需要信息的性质、调查对象的特点、对数据质量和回答率的要求,以及预算费用和时间要求等多方面因素综合而定。 各种方法并不是相互排斥的。如先采用自填式,然后对未回答的再采用电话跟踪或面访。,2.3 实验数据,一、实验组与对照组 实验方法的基本逻辑是:有意识地改变某个变量(A项)的情况,然后看另一个变量(B项)变化的情况。如果B项随着A项的变化而变化,就说明A项对B项有影响。,将研究对象随机分为两个组,一个称为实验组,一个称为对照组。在实验组中每个单位接受某种特别的处理,而在对照组中不接受实验组成员所接受的某种特别处理。,如英国海军为了印证缺乏柑橘类水果是否是导致长期在海上工作的水手患坏血病的原因,对四艘军舰上的水手进行了实验,其中一组有充足的柑橘汁供应,另外三艘军舰上的水手没有柑橘汁供应。,在这里,喝柑橘汁的水手们构成了实验组,没有喝柑橘汁的水手们构成了对照组。实验结果是假定成立。,若没有对照组,就无法判定A项是否对B项产生影响。,二、实验中的若干问题,1、人的意愿 人们都有自己的生活方式和处世原则,都有自己的爱好 和兴趣,不一定会接受实验所要求的控制条件。,2、心理问题 人们对被研究的敏感性反应会影响实验的结果。,3、道德问题 当某种实验涉及道德问题时,人们会外于进退两难的尴尬境地。(如对治疗艾滋病新药的疗效实验)无论有效或无效都存在道德困境。,第四节 统计调查方案的设计,一. 确定调查目的和任务 二. 确定调查对象、调查单位和填报单位 三. 设计调查项目和调查表 四. 方案设计中的其他内容,一、确定调查目的和任务,1.调查要达到的具体目标 2.回答“为什么调查?” 3.调查之前必须明确,二、确定调查对象、调查单位和填报单位,调查对象:调查研究的总体或调查范围 调查单位:需要对之进行调查的单位。 回答“向谁调查?”,注意调查单位与填报单位 的区别:,当调查单位自己负责向上报告时,它同时也是填报单位;当调查单位的资料由它的上级组织收集整理并向上报告时,填报单位与报告单位则不一致。,1调查某市工业企业职工的工种、工龄、文化程度等情况,则( ) A调查单位与填报单位是每个工业企业 B调查单位与填报单位是每个职工 C调查单位是每个企业,填报单位是每个职工 D调查单位是每个职工,填报单位是每个企业,三、调查项目和调查表,1.调查项目:调查的具体内容 2.调查表:表现调查项目的表格或问卷 3. 回答“调查什么?”,表头,表体,表脚,名称、编号、制表单位、填表日期等等,被调查者的基本情况、调查项目等等,备注、指标解释等,调查表的基本结构:,2统计调查项目大多数放在( ) A调查表的表头中 B调查表的表体中 C调查表的表脚中 D调查对象之中,四、方案设计中的其他问题,1.明确调查所采用的方法 2.确定调查资料的所属时间和调查工作的期限 3. 调查的组织与实施细则,第五节 统计调查误差,一. 统计调查误差 二. 统计数据的质量要求,第五节 统计调查误差,调查误差,指收集来的数据资料与真实情况间的差异,调查误差,指收集来的数据资料与真实情况间的差异,真值?,调查值,调查误差?,研究调查误差的主要目的是找出导致误差产生的原因,进而采取对策避免、减少误差或控制误差水平。,数据误差的种类,由于人的主观故意或失误而产生的误差,理论上它可以用某种方法加以消除,由部分单位数值来推断总体数值所产生的误差,它不可以消除,但可以加以控制,(随机误差),抽样误差:,非抽样误差:,指出下面的陈述哪一个是错误的() A 抽样误差是可以避免的 B 非抽样误差是可以避免的 C 抽样误差是不可避免的 D 抽样误差是可以控制的,误差的控制,(1)对于抽样误差:改变样本量等 (2)对于非抽样误差: 抽样框的改进 调查问卷设计合理 调查过程的质量控制,二、统计数据的质量要求,统计数据的质量 就是指它符合客观实际的程度,即数据的准确度。,二、统计数据的质量要求,1. 精 度:最低的抽样误差 2. 准 确 性:最小的非抽样误差 3. 关 联 性:满足用户决策、管理和研究的需要 4. 及 时 性:在最短的时间里取得并公布数据 5. 一 致 性:保持时间序列的可比性 6. 最低成本:以最经济的方式取得数据,26 数据文件,进行研究所需要的数据,不论是通过调查方法取得的,还是通过实验取得的,都要录入计算机,形成数据文件。,文件由行和列组成,行代表样本单位,列表示不同的变量。,问题1:在可乐和雪碧中你更喜欢哪一个? 问题2:你知道最近新出产一种脱糖的可口可乐吗?,如果用数字来代表分类的文字 男1 女0 可乐1 雪碧0 知道1 不知道0 上表可变为,把数据转化为数字,用数字代替后,录入比较方便,外理也变得简单一些。,1先按一定标志将总体划分为不同的层,再在总体各层中分别随机抽选若干单位共同构成样本的抽样组织形式称为( ) A简单随机抽样 B分层抽样 C系统抽样 D整群抽样,课后练习,2将总体各单位按一定标志排队, 然后按相等距离(间隔)抽取一定数目的总体单位构成样本的抽样组织形式称为( ) A简单随机抽样 B分层抽样 C系统抽样 D整群抽样,3将总体各单位划分成若干群,然后以群为单位从其中随机抽取一些群,对中选群的所有单位进行全面调查的抽样组织形式称为( ) A简单随机抽样 B分层抽样 C系统抽样 D整群抽样 4抽样误差是指( ) A登记误差 B随机性代表性误差 C系统性代表性误差 D前三类都不是,
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!