资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第三章 统计数据的整理与显示,第一节 统计整理的意义和程序,一、统计整理的意义,二、统计整理的程序,统计整理是承上启下的过程,是统计调查的继续也是统计分析的根底。,统计整理:,根据统计研究的目的,对调查所得原始材料进行科学分组与汇总和对以往的材料进行再加工。,统计整理最后的结果就是形成各种统计表格和统计图。,统计整理的意义:是统计调查的继续,是统计分析的根底。,统计整理的程序,对搜集到的资料进行全面的审核,确保符合研究目的要求和准确无误,选择整理的指标,并进行划,类分组,将分,组资料进行汇总,编制统计表和统计图,第二节 统计资料的审核,(一)审查资料的完整性和及时性,完整性:检查应调查的单位或个体是否有遗漏,所有的调查工程或指标是否填写齐全,及时性:检查填报单位是否按时报送了有关,二审查资料的正确性,数据是否真实反映客观实际情况,内容是否符合实际,数据是否有错误,计算是否正确等,准确的资料是进行正确统计分析的关键。,(三).历史资料的审核,应审查资料的可靠性程度,指标含义,所属时间,计算方法等,对不能满足现在要求,有缺漏或有疑问的资料,要进行有科学依据的推算,弥补和订正,。,(,四)资料审核后的订正,对可以肯定的一般错误,代为更正,并通知原报单位。,对可疑数据或无法代为更正的错误,要求原单位复查更正,如果所发现错误在其他上报单位也可能发生时,应通知其他单位。,对严重错误,应发还重填,并查明错误原因。,第三节 统计分组,一、统计分组的含义,二、统计分组的作用,三、统计分组的种类,四、分组标志的选择,五、组数、组距、组限、组中值,一、统计分组的含义,统计分组:指根据社会经济现象的特点和统计研究的任务,按某个标志或几个标志把总体分成假设干局部的科学分类。没有统计分组就没有科学的统计,统计分组的关键:,1、选择分组标志:使组间差异大,组内差异小,2、划分各组界限。,二、统计分组的作用,划分社会经济现象的不同类型,揭示社会现象的内部结构,分析社会现象之间的依存关系,划分社会不同类型,按商品分类分组,构成(%),食品类,衣着类,家庭设备用品类,文化娱乐用品类,交通通讯类,医疗保健类,居住类,杂项商品类,40.6,4.7,7.5,11.6,10.8,4.7,14.4,5.7,合计,100,揭示社会经济现象的内部结构,年份,农副产品,农副产品加工品,工矿产品,合计,1950,1960,1970,1980,1985,1990,1995,1999,57.5,31.0,36.7,18.7,17.5,13.0,7.3,5.2,33.2,42.3,37.7,29.5,26.9,29.2,26.2,25.1,9.3,26.7,25.6,51.8,55.6,57.8,66.5,69.7,100,100,100,100,100,100,100,100,我国出口商品构成(%),划分社会现象的依存关系,按商品销售额分组(万元),商店数(个),流通费用率(%),100以下,100,500,500,1000,1000,3000,3000,5000,5000,10000,10000以上,25,70,130,75,40,18,10,11.2,10.6,9.9,8.7,7.8,7.0,6.3,三、统计分组的种类,按分组的作用或目的不同分为:类型分组、结构分组和分析分组,按分组标志多少,分为:简单分组、复合分组和并列分组。,按分组标志的性质分为品质分组和数量分组,四、分组标志的选择,1.分组标志:,是指将总体划分为性质不同的组的标准或依据。,2.分组标志选择的要求:,要符合统计研究的目的和要求,必须选择最主要的标志作为分组依据,要考虑社会经济现象所处的具体历史条件,五、组数、组距、组限、组中值,组数:即将总体分为几组。,组数确实定分下面两种情况:,一品质分组的组数,由两个因素决定:,1、事物本身的属性特征,2、统计研究的要求,二数量分组的组数和组距,1.组数由两个因素决定:,总体的全距,R,组距,(,class width),全距R=最大标志值最小标志值,组距=各组最大标志值上限各组最,小标志值下限,在等距分组的条件下,组数等于全距除以组距,2.组数、组距确定的斯特杰斯经验公式,N,15-24,25-44,45-89,90-179,180-359,360-719,n,5,6,7,8,9,10,适用条件:,1.近似正态分布 2.现象特性适合等距分组,组限:指每组两端数值。分为上限和下限。上限:每组的终点数值最大值。下限:每组的起点数值最小值。组限的形式:与变量的特点有关,重合式和不重合式,1、重合式:,指相邻两组中,前一组的上限和后一组的下限数值重合。,一般用于连续型变量。,组距=上限下限,例如:身高1.60m1.70m、1.701.80m、1.801.90m,所谓重合只是形式上相重,实际上两组没重合,一般采用“含下限不含上限原那么处理,组 限,2、不重合式,指前一组的上限与后一组的下限,两值紧密相连而不相重复。,一般用于离散型变量。,组距,=,下组下限本组下限,=,本组上限前组上限,例:人口普查时,按照家庭人口数分组:,1-2,,,3-4,,,5-6,,,7,和,7,以上,组 中 值,组中值:各组上下限的中点值,代表组内各标志值的一般水平。,重合式组限时:,组 距=上限下限,组中值=上限下限2,=下限组距/2=上限组距/2,不重合式组限时:,组 距=下组下限本组下限=本组上限前组上限,组中值=(本组下限下一组下限)2,=本组下限组距/2=下组下限组距/2,组距式分组中:,第一组开口多少以下,组中值上限相邻组组距/2,最后一组开口多少以上,组中值下限+相邻组组距/2,第四节 统计汇总,一、统计汇总:即在统计分组的根底上,将统计资料归并到各组中去,并计算各组和总体的合计数包括单位总数和标志总量的工作过程。,二、统计汇总的形式:,1、逐级汇总,2、集中汇总,3、汇审汇编,4、综合汇总,三、统计汇总的技术,1、手工汇总,2、电子计算机汇总,第五节 分布数列,分布数列也称次数分布或次数分配,指反映总体单位在各组分布状况的一系列数字。,分布数列组成要素:,1、组的名称,2、各组次数也称频数或频率,分布数列的分类,按分组标志 品质数列,变量数列,分,布 钟形分布数列 正态分布,数 偏态分布 左偏分布,列 按次数分布特征 右偏分布,U形分布数列,J形分布数列 J形,倒J形,按分组形式 单项式数列,组距式数列 等距数列,异距数列,按分组标志不同分为品质数列和变量数列,1.品质分布数列例:,各组名称,次数(频数),频率,100,1000,合计,60,40,600,400,男性,女性,所占,人数,按性别分组,2.变量数列例:,各组名称,次数(频数),频率,100,1000,合计,8,15,23,34,15,5,80,150,230,340,150,50,1000元以下,1000-1500,1500-2000,2000-2500,2500-3000,3000元以上,所占(),人数(人),按月工资收入分组,按照分组形式不同分为单项式数列和组距式数列,1单项式数列:各组由一个具体的变量值单项来表示的数列。,单项式分组一般适用于离散型变量且变量变动范围不大的场合。,变量是离散变量,变量的不同取值个数较少,编制条件:,【例】己知某车间有24名工人,他们的日产量件分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。,单项分组举例,日产量(件),X,工人数(人),f,20,21,22,23,24,25,26,3,5,6,4,3,2,1,合计,24,编制结果如下:,2组距式分组:组距式分组是以变量值变动的一定范围区间作为一组,区间的距离就是组距。这样的分组所形成的变量分配数列叫组距式变量数列,简称组距数列。,每一组变量值中,其最小值称为下限,最大值称为上限。对于连续型变量或者变动范围较大的离散型变量,适宜采用组距式分组。,等距数列,不等距数列,按次数分布不同分为钟型分布数列U型分布数列、J型分布数列,钟型分布:,特征是“两头小,中间大,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少,其形状宛如一口古钟。,U型分布:,特征是靠近中间的变量值分布的次数少,,靠近两端的变量值分布的次数多,其形状,宛如英文字母U。如:人口死亡率。,J型分布:,特征是次数随着变量值的增大而增多或随变量值的增大而减少,其形状宛如英文大写字母J,简单分布数列的编制,1、品质分布数列的,方法:只需将品质标志的表现一一排列出来,然后汇总出每一种标志表现出现的次数即可。如下例:,经济类型,企业数(个),比重(%),国有企业,股份制企业,合资企业,独资企业,100,80,50,20,40,32,20,8,合 计,250,100,2、变量分布数列的,第一步:将原始资料按数值大小依次排列。,第二步:确定变量的类型和分组方法单变量分组或组距分组。,第三步:确定组数和组距。当组数确定后,组距可计算得到:,组距=全距/组数,全距=最大变量值最小变量值。,第四步:确定组限。第一组的下限要小于或等于最小变量值,,最后一组的上限要大于最大变量值。,第五步:汇总出各组的单位数注意:离散型变量各组单位,数的汇总方法,计算频率,并编制统计表。,步骤为,:,简单次数分布图的编制,1、单项式数列次数分布图,以变量为横轴,以次数为纵轴,绘制曲线图。,2、组距式数列次数分布图,1等距数列,2不等距数列换算成标准组距次数,累计次数分布表的编制,1、以下累计:即从低组到高组累计,表示该组上限以下的次数频率有多少。向上累计,2、以上累计:即从高组到低组累计,表示该组下限以上的次数频率有多少。向下累计,累计次数分布图的编制,编制方法:以变量为横轴,累计次数和累计频率为纵轴,绘制累计次数分布表。,累计次数分布,通过累计频数分配数列可以反映累计到某一组出现的总次数或总频率。想一想:第四组的累计结果说明什么问题?,序 计划完成 工人数 比重 向上累计 向下累计,号 程度(%)(人)(%)人数 比重 人数 比重,1 60 70 2 1.0,2 70 80 5 2.5,3 80 90 14 7.0,4 90 100 31 15.5,5 100110 65 32.5,6 110120 52 26.0,7 120130 23 11.5,8 130140 8 4.0,合 计 200 100,2,7,21,52,117,169,192,200,1.0,3.5,10.5,26.0,58.5,84.5,96.0,100,8,31,83,148,179,193,198,200,4.0,15.5,41.5,74.0,89.5,96.5,99.0,100,第六节 统计资料的显示,统计表是集中而有序地表现统计资料的表格。,统计表的结构,1.从形式组成因素:横行、纵栏、标题、标目、数字资料,2.从内容:主词、宾词,统计表的种类,1.按用途分:调查表汇总表分析表,2.按主词的分组情况分简单表分组表复合表,宾词指标设计,1.平行设计;2.层叠设计,制表规那么,1.标题醒目准确,2.内容简明扼要,3.工程排列有序,4.字迹清楚标准数字按个位数上下对齐,无数填号,缺报填号,5.各栏应加编号,6.规格符合要求上下粗线,左右开口,栏间划线,行间空白,统计图,统计图:是具体显示统计资料的图形。,1、直方图粉红色是累计曲线图,2、折线图,统计图,3、饼形图,统计图,4、柱形图,统计图,5、散点图,统计图,本章的重点是统计分组的概念、作用,难点是掌握并运用统计分组的种类。,统计整理作业,1、对某厂50个计件工人某月份工资进行登记,获得以下原始资料单位:元,1465 1760 1985 2270 2980 1375 1735 1940 2220 2670,1405 1755 1965 224
展开阅读全文