第2章 数据的收集

上传人:仙*** 文档编号:246075456 上传时间:2024-10-12 格式:PPT 页数:65 大小:1.27MB
返回 下载 相关 举报
第2章 数据的收集_第1页
第1页 / 共65页
第2章 数据的收集_第2页
第2页 / 共65页
第2章 数据的收集_第3页
第3页 / 共65页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,第二章 数据的收集与整理,2,数据收集与整理,数据的收集,数据的整理,2.1,数据的收集,统计数据来源,统计数据收集的原则和方法,统计调查方案,统计调查问卷,统计数据收集的组织形式,2.1.1,统计数据来源,统计数据来源:直接来源、间接来源,直接来源,:,通过自己的调查或实践活动直接获得的第一手统计数据即原始统计数据,称为统计数据的直接来源。,间接来源,:,如果与研究内容有关的资料是别人调查获得的,或者有一些是历史遗留的统计数据,现在只是对这些原有的信息重新加工整理,使之成为进行统计分析可以使用的数据,将其称为统计数据的间接来源。,2.1.2,统计数据收集的原则和方法,统计数据收集的原则:,1,、准确性原则,2,、及时性原则,3,、系统性原则,4,、完整性原则,统计数据收集的方法:观察法、报告法、询问法。,2.1.3,统计调查方案,一个完整的统计调查方案应包括:,1,、确定调查目的和任务,2,、确定调查对象和调查单位,3,、拟定调查提纲和调查表,4,、确定调查的时间和方法,2.1.4,统计调查问卷,问卷的类型与结构,问卷设计应注意的问题,2.1.4,统计调查问卷,一、问卷的类型,按问卷填写方式划分,可将调查问卷分为自填式问卷和访问式问卷,二、调查问卷的基本结构,一份完整的调查问卷,通常由题目、说明信、被调查者基本情况、调查事项的问题和答案、填写说明与解释等,5,个主要部分构成。,2.1.5,统计数据收集的组织形式,统计数据收集的组织形式:,1,、统计报表,2,、专门调查,2.1.5,统计数据收集的组织形式,一、统计报表,1,、统计报表的概念,统计报表:,统计报表是按照国家统一规定的表格形式、统一规定的指标内容、统一规定的报送程序和报送时间,由填报单位自下而上逐级提供统计资料的一种统计调查方式。,2.1.5,统计数据收集的组织形式,2,、统计报表的类型,(,1,),月报、年报和其他时间报表,;,(,2,),邮寄报表和电讯报表,;,(,3,),基层报表和综合报表,;,(,4,),国家报表、部门报表和地方报表,2.1.5,统计数据收集的组织形式,3,、统计报表的内容,(,1,)报送目录,(,2,)报表表式,(,3,)填表说明,2.1.5,统计数据收集的组织形式,二、专门调查,专门调查包括:,1,、普查,2,、抽样调查,3,、重点调查,4,、典型调查,2.1.5,统计数据收集的组织形式,普查,:,是为特定目的而专门组织的一次性或周期性的全面调查。,如全国人口普查、工业普查、科技人员普查等。,普查的目的在于收集那些不能够或不适宜用其他统计调查方式收集的统计数据,以掌握重要的国情、国力数据。,我国统计制度规定,:,每逢年份的末尾数字为“,0,”的年份进行全国人口普查,;,每逢末尾数字为“,5,”的年份进行全国工业普查,;,每逢末尾数字为“,6,”的年份进行全国农业普查,;,每逢末尾数字为“,3,”和“,8,”的年份进行全国经济普查,;,普查的组织原则是:,1,、,统一规定调查资料所属的标准时点,。,2,、,各调查单位各调查点尽可能同时进行调查,并尽可能在最短期限内完成,。,3,、,调查项目一经统一规定,不能任意改变或增减,。,二、专门调查,(,抽样调查,),1,、,抽样调查,:,是根据随机原则的要求,从总体中抽取部分个体构成样本,并依据样本信息推断总体数量特征的一种调查方法。抽样调查是非全面调查,。,2,、 抽样调查的适用范围:,用于破坏性检验场合的调查和推断,;,用于较大规模总体或无限总体的调查,;,用于检查和补充全面调查数据,;,二、专门调查,(,重点调查,),1,、,重点调查,:,是在调查对象中,选择一部分重点单位进行调查。重点调查是一种非全面调查,。,2,、,重点单位,:,是指在总体中具有举足轻重地位的那些单位,虽然它们在调查对象的全部单位中只是一小部分,但其标志总量在被研究总体的全部标志总量中却占绝大比重。,例如,大庆油田、胜利油田和中原油田等几个大油田,虽然在全国的石油企业中只是少数,但它们的原油产量却占全国原油产量的绝大部份,所以,对这几个重点油田进行调查,就可以了解我国原油生产的基本情况。,重点单位的选择要根据调查任务来确定。一般说来,选出的单位应尽可能少些,而其标志值在总体标志总量中所占比重应该尽可能大些 。,另外,选中的单位的经营管理制度应比较健全,统计力量应比较充实,统计基础应比较牢固,这样才能准确、及时地取得资料。,二、专门调查(,典型调查,),典型调查,:,是根据调查的目的与要求,在对被调查对象进行全面分析的基础上,有意识地选择若干具有典型意义或有代表性的单位进行深入、细致的调查研究,借以认识事物发展规律的一种调查方式。,典型调查是一种非全面调查。,典型调查的主要目的,不在于取得社会经济现象的总体数值,而在于了解与有关数字相关的具体情况。其作用是补充全面调查的不足。,典型调查的优点,是调查范围小,调查单位少,灵活机动,节省人力、物力和财力等。其不足是在实际操作中选择真正有代表性的典型单位比较困难,而且还容易受人为因素的干扰,从而可能导致调查结论有一定的倾向性。,典型调查大体上可以分为两种,:,一种是对个别典型单位进行“解剖麻雀”式调查,。,其目的在于通过个别单位特征说明现象的一般情况或规律性;,另一种是“划类选典”式的典型调查,。,即在对调查总体进行分类的基础上选择一部分典型单位,由这一部分典型单位构成一个代表性的样本总体,然后对这个样本总体进行调查,根据其调查结果,从数量上对总体进行统计推断和统计分,析。,2.2,数据的整理,统计整理的概念和意义,统计整理的步骤,统计分组,次数分布,变量数列的编制,次数分布的表现形式,统计资料的汇总,统计表和统计图,2.2.1,统计整理的概念和意义,一、统计整理的概念,统计整理:是根据统计研究的任务与要求,对统计调查所搜集到的原始资料进行科学的综合与加工,使之系统化、条理化的工作过程。,总产值(万元),0-50,50-100,100-150,150-200,200-250,合计,企业数(个),10,24,35,21,10,100,表,2-1 2005,年,12,月某市工业企业总产值分布表,二、统计整理的意义,经过统计整理,实现了从个别单位的数量特征到总体数量特征的第一次综合,得到了描述现象总体数量特征的最初始的综合指标,。,2.2.2,统计整理的步骤,统计整理的步骤包括:,1.,、制定统计整理方案,2,、审核、纠正统计数据资料,3,、进行科学的统计数据分组与汇总,4,、编制统计表和绘制统计图,2.2.3,统计分组,统计分组的概念与作用,分组标志的选择,统计分组的方法,一、统计分组的概念,统计分组:,就是根据统计研究的目的和现象总体的内在特征,按照一定的标志将统计总体划分为若干个性质不同而又有联系的几个部分的一种统计方法。,二、统计分组的作用:,1,、统计分组可以划分社会经济现象的类型。,2,、统计分组可以研究现象的内部结构。,3,、统计分组可以分析现象之间的相互依存关系。,三、分组标志的选择,选择分组标志遵循以下原则:,1,、根据统计研究的目的选择分组标志。,2,、根据事物内部矛盾选择反映事物本质的分组标志。,3,、根据被研究事物所处的具体条件选择分组标志。,四、统计分组的方法,1,、按品质标志分组或按数量标志分组,按品质标志分组:是指选择反映事物属性差异的品质标志作为分组标志,并在品质标志的差异范围内划分各组界限,将总体划分为性质不同的组成部分。,如职工按性别、文化程度、工种分组;企业按经济类型、地区分组;学生按生源、性别分组等都是按品质标志分组,。,2,、简单分组和复合分组,简单分组:,就是按一个标志对总体进行分组。如学生按学习成绩分组,企业按生产规模分组。,复合分组:,是指对总体按两个或两个以上的标志层叠起来进行的分组,即将总体先按一个分组标志进行分组,在此基础上按另一个分组标志把已分成的各个组成部分再分成若干小组。,例如,学生先按性别分组,在此基础上,再按年龄分组就是复合分组。,2.2.4,次数分布,次数分布的概念,次数分布的种类,累计次数分布,次数分布类型,一、次数分布的概念,在统计分组的基础上,将总体的所有单位按组归类整理,所形成的总体单位数在各组之间的分布,称为,次数分布,。,分布在各组的总体单位数叫,次数或频数,。各组次数与总体总次数之比称为,比重或频率。,次数分布有两个构成要素:,一是总体分成的各个组,二是各组的单位数。,二、次数分布的种类,根据分组标志特征的不同,次数分布可以分为品质分布数列和变量分布数列。,变量数列按变量的表示方法不同,可分为单项变量数列和组距变量数列两种,。,1,、按品质标志分组所形成的分布数列,称为品质分布数列,简称,品质数列,。,品质数列由各组名称和次数构成。,某企业工人性别构成情况表,按性别分组,职工人数(人),比重(,%,),男,650,65,女,350,35,合计,1000,100,各组名称,次数,频率,2,、,按数量标志分组所形成的次数分布数列叫变量分布数列,简称,变量数列,。,变量数列由各组变量值和各组次数构成。,按成绩分组,人数(人),比重(,%,),60,以下,4,10,60-70,6,15,70-80,16,40,80-90,10,25,90,以上,4,10,合计,40,100,各组名称,次数,频率,某班学生统计学成绩分布表,(,1,)单项变量数列,单项变量数列是按数量标志分组后,,用一个变量值代表一个组所形成的数列,简称单项数列,。,适用于变量值个数较少,变量值变动范围较小的离散型变量。,平均日产量,工人数,绝对数(人),比重(,%,),7,8,16,8,18,36,9,19,38,10,5,10,合计,50,100,某车间第一季度工人平均日产量,(,2,)组距变量数列,组距变量数列是按照数量标志分组后,用变量值变动的一定范围代表一个组所形成的数列。,适用于变量值个数较多,变动范围较大的离散型变量以及所有的连续型变量,按成绩分组,人数(人),比重(,%,),60,以下,4,10,60-70,6,15,70-80,16,40,80-90,10,25,90,以上,4,10,合计,40,100,某班学生统计学成绩分布表,(,2,)组距变量数列,在组距数列中,表示各组界限的变量值叫组限,其中较小的变量值称为下限,较大的变量值称上限。,各组上限与下限之间的距离叫组距,上限与下限之间的中点值叫组中值。,组距,=,上限,-,下限,组中值,=,(上限,+,下限),/ 2,(,2,)组距变量数列,在编制组距数列时,常常使用,“,某某以上,”,或,“,某某以下,”,,这样不确定组限的组,称为开口组。,开口组的组中值按下列公式计算:,缺下限的最小组的组中值,=,上限,-,相邻的组距,/2,缺上限的最大组的组中值,=,下限,+,相邻的组距,/2,(,2,)组距变量数列,组距数列根据各组的组距是否相等可以分为等距数列和异距数列。如果各组的组距相等,称为,等距数列,;如果各组的组距不相等,称为,异距数列,。,一般在社会经济现象性质差异变动比较均衡的条件下使用等距数列。如,学生的学习成绩分组,工人的工资。,异距数列则能比较准确反映总体内部各部分之间的性质差异。,三、累计次数分布,累计次数分布,:,是将变量数列各组的次数和频率逐组累计相加而形成的次数分布,。,累计次数分布有向上累计和向下累计两种计算方法。,向上累计,:,是将各组次数和频率由变量值低的组向变量值高的组逐组累计,各累计数的意义是各组上限以下总共所包含的总体次数和比率有多少。,向下累计,:,是将各组次数和频率由变量值高的组向变量值低的组逐组累计,各累计数的意义是各组下限以上总共所包含的总体次数和频率有多少。,某班学生统计学原理考试成绩分布表,学生成绩(分),人数(人),比例(,%,),向上累计,向下累计,人数(人),比例(,%,),人数(人),比例(,%,),60,以下,4,10,4,10,40,100,60-70,6,15,10,25,36,90,70-80,12,30,22,55,30,75,80-90,15,37.5,37,92.5,18,45,90-100,3,7.5,40,100,3,7.5,合计,40,100,四、,次数分布类型,次数分布类型包括:,1,、,钟形分布,2,、,J,型分布,3,、,U,型分布,1,、,钟形分布,:,钟形分布的特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少,其曲线宛如一口古钟,如图所示。,偏态分布,正态分布,2,、,J,型分布,:,一种是次数随着变量的增大而增多,如投资按利润率大小分布。另一种呈反,J,型分布,即次数随着变量增大而减少,如随着产品产量的增加,产品单位成本下降。,J,型分布如图所示,。,J,型分布,3,、,U,型分布,:,其,形状与钟形分布相反,靠近中间的变量值分布次数少,靠近两端的变量值分布次数多,形成“两头大,中间小”的,U,型分布。如人口死亡率分布就属于这种类型。,U,型分布如图所示,。,U,型分布,2.2.5,变量数列的编制,一、编制变量数列,要注意以下问题:,1,、确定形式,2,、确定组距和组数,3,、确定组限,二、变量数列编制步骤,例如,某生产小组,40,名工人日产量分为高、中、低,3,组,每人的某日产量如下(单位:件),660 700 450 460,460,480 640 490 540 500 650 550 560,560,560,590 580 560 570,570,580 590,590,550 590 560 590 600 590 600 640 480 650 490 750 660 450 560 750 710,第一步:将原始资料按大小顺序排列,。,450,450,460,460,480,480,490,490,500 540 550,550,560,560,560,560,560,560,570,570,580,580,590,590,590,590,590,590,600,600,640,640,650,650,660,660,700 710 750,750,第二步:确定组距和组数。,上述资料排序后,最小值为,450,件,最大值为,750,件。,全距,=750-450=300,组数,=3,组距,=,全距,/,组数,=300/3=100,第三步:确定组限。,组限为:,500,、,600,第四步:编制变量数列,。,按日产量分组(件),人数(人),比重(,%,),500,以下,8,20,500-600,20,50,600,以上,12,30,合计,40,100,2.2.6,统计资料的汇总,统计资料汇总,:,就是在编制次数分布后,汇总计算各组及总体的单位数以及各组及总体的标志总量,。,统计资料汇总的组织形式一般有:逐级汇总、集中汇总和综合汇总。,统计资料的汇总技术有,:,手工汇总和计算机汇总。,统计资料的汇总,的组织形式,1,、,逐级汇总,:,就是按照一定的统计组织管理系统,自下而上地逐级汇总本系统、本地区、本单位的调查资料。,2,、,集中汇总,:,就是将全部调查资料集中到组织调查的最高机关或其指定的机构进行汇总。,3,、,综合汇总,:,即将逐级汇总和集中汇总两种汇总形式结合起来使用,。,2.2.7,统计表和统计图,数据整理的结果最终表现为统计表和统计图。,统计表,:,是以纵横垂直交叉的直线绘制的用来表现统计数字资料的表格。,统计图,:,是以直观、形象的图形,将数据的分布特征呈现出来的重要辅助工具,。,人口按性别分组,人数(万人),比重(,%,),男性,65772,51.46,女性,61955,48.54,合计,127627,100.00,2001,年全国人口构成统计表,本表按当年价格计算,资料来源:,2008,中国统计年鉴,.,北京:中国统计出版社,,2008.,行标题,列标题,数据,注释,统计表的构成如下:,(主词),(宾词),表头,统计图,:,是以直观、形象的图形,将数据的分布特征呈现出来的重要辅助工具。,常用的统计图有,柱,形图、饼图、直方图和折线图,。,2.2.7,统计表和统计图,下图是根据教材表,2.7,(,2005-2007,年我国国内生产总值)绘制的柱形图。,2.2.7,统计表和统计图,下图是根据教材表,2.7,(,2005-2007,年我国国内生产总值)绘制的柱形图。,2.2.7,统计表和统计图,下图是根据教材表,2.6,(,某生产小组工人日产量分布直方图,)绘制的直方图。,2.2.7,统计表和统计图,下图是根据教材中表,2.7,(,2005-2007,年我国国内生产总值)绘制的折线图。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!